相关文章

【非专业前端】vue+element+webpack

先点这里(~ ̄▽ ̄)~ 环境搭建 默认你已经安装了node.js 下面安装vue和webpack npm install -g vue/cli npm install -g vue/cli-initnpm install -g webpack npm install -g webpack-cli webpack-simple方式 下面找到你的工程根目录…

Android与kotlin报错

前言 记录下我遇到kotlin的错误与解决方法,希望对你有所帮助 记录我遇到的kotlin与android的问题 第二篇Android与kotlin报错2 第三篇Android与kotlin报错3 一 错误信息 Kotlin: Cannot access java.io.Serializable’ which is a supertype of ‘kotlin.Int’.…

spring boot 项目报错 java.sql.SQLException: The server time zone value ‘�й���׼ʱ��‘

控制台信息 问题原因 因为mysql-connection-java版本导致时区的问题。可以在自己的SpringBoot配置文件中,对数据库连接信息中添加好时区相关配置 解决方式

SQL语言的3种分类

SQL语言按照实现的功能不同,主要分为3类:数据操纵语言(DML),数据定义语言(DDL),数据控制语言(DCL)。 1.数据操纵语言(DML):主要用来处…

SQL 表连接

在sql中表连接方式有left join (左连接);rith join(右连接);inner join(内连接);full join(全连接);union all (上下拼接) union (上下去重拼接) left join (左连接): 左连接是将左表作为底层表…

sql注入手法详解

sql定义 sql--结构化查询语句 sql注入:首先我们通过前端将我们的payload(恶意代码)传送到后台服务器 传送到后台以后 我们提交的payload拼接到sql语句中 作为sql语句的一部分被执行 从而导致数据库又被脱库甚至删库的风险 使得数据库受损 sql注入手法 sql注入可…

SQLserver常用时间函数

--1、GETDATE()获取当前日期 SELECT GETDATE() --2、DAY|MONTH|YEAR 函数返回指定日期所在 日/月/年的部分 SELECT YEAR(GetDate()) as 年; SELECT MONTH(GetDate()) as 月; SELECT DAY(GetDate()) as 日; --3、DATENAME函数返回指定日期的指定部分,返回字符串。获取年、月…

SQL行列转换

常见的行列转换包括以下四种情况: 1.列转行 2.行转列 3.列转换成字符串 4.字符串转换成列 1.列转行 导入数据 DROP TABLE IF EXISTS t_student; CREATE TABLE t_student (id int(20) NOT NULL AUTO_INCREMENT COMMENT 主键 id,name varchar(50) DEFAULT NULL COMM…

【spark】RDD数据源

1、普通文本文件 sc.textFile("./dir/*.txt") 如果传递目录,则将目录下的所有文件读取作为RDD。文件路径支持通配符。 但是这样对于大量的小文件读取效率并不高,应该使用wholeTextFiles def wholeTextFiles(path: String, minPartitions: …

pyspark:RDD和DataFrame

作为数据挖掘工程师,以后必不可免要用到并行计算,pyspark是python操作spark的API,本人因此入了坑。 1 pyspark的安装 见我另一篇博客:https://blog.csdn.net/qq_23860475/article/details/90476197 2 spark概述 Spark 允许用户读…

Spark 入门 RDD操作

Spark版本: 3.1.3 RDD 支持两种类型的操作: 转换操作(transformations): 从现有数据集创建一个新数据集动作操作(actions): 在数据集上进行计算后将值返回给 Driver 例如,map 是一个转换操作,将数据集每个元素传递给一个函数并返回一个新 R…

Spark之RDD算子

🐱今天出一期spark系列的硬货,即RDD算子,所谓算子,就是对某些事物的操作,或者说是方法。本期主要介绍几十个RDD算子,根据他们的特点,逐一进行介绍,有关spark的往期内容大家可以查看下…

Spark RDD之Partition

概要 Spark RDD主要由Dependency、Partition、Partitioner组成,Partition是其中之一。一份待处理的原始数据会被按照相应的逻辑(例如jdbc和hdfs的split逻辑)切分成n份,每份数据对应到RDD中的一个Partition,Partition的数量决定了task的数量&…

【spark】RDD-API

一、创建RDD 1.由外部存储系统的数据集创建,由外部存储系统的数据集创建,包括本地的文件系统,还有所有Hadoop支持的数据集,比如HDFS、Cassandra、HBase等 val rdd1 sc.textFile("hdfs://node01:8020/wordcount/input/word…

【大数据】Spark弹性分布式数据集RDD详细说明

文章目录 整体介绍一、定义与特性二、操作与转换三、存储级别与持久化四、依赖关系与容错机制五、优化与性能调优 常见操作支持的数据格式1.文本文件 (Text Files)2. CSV 文件3. JSON 文件4. Parquet 文件5. Sequence Files6.Hadoop文件读取A. 读取HDFS上的文本文件B. 使用Hado…

Spark RDD算子

RDD算子 ​ RDD被创建后是只读的,不允许修改。Spark提供了丰富的用于操作RDD的方法,这些方法被称为算子。一个创建完成的RDD只支持两种算子:转化(Transformation)算子和行动(Action)算子。 转…

RDD编程初级实践

目录 一、实验目的二、实验内容1. 熟悉RDD编程2. pySpark交互式编程3. 编写独立应用程序 一、实验目的 熟悉Spark的RDD基本操作及键值对操作;熟悉使用RDD编程解决实际具体问题的方法。 二、实验内容 1. 熟悉RDD编程 转换操作 filter(func)操作会筛选出满足函数fu…

RDD实现

解析器集成 Scala解析器处理一般过程: 1 将用户输入每一行编译成一个类 2 将该类载入到JVM中 3 调用该类中的某个函数 内存管理 1 未序列化Java对象存储在内存中 2 序列化的数据存于内存中 3 存于磁盘中 内存使用LRU(最近最少)回收算法管理 RDD编程接口 1 RD…

PySpark RDD操作

前提条件: 1、拥有Ubuntu16.04环境 2、Ubuntu下安装好Spark和PySpark 题目一:RDD创建 首先进入pyspark命令行 $ pyspark (1)从文件中加载 从本地文件创建RDD >>> lines sc.textFile("file:///home/hadoop/da…

RDD的创建方式

RDD的创建方式 1. 实验室名称:2. 实验项目名称:3. 实验学时:4. 实验原理:5. 实验目的:6. 实验内容:7. 实验器材(设备、虚拟机名称):8. 实验步骤:8.1 启动Spark集群8.2 启动zeppelin服务器8.3 创建notebook文档8.4 从内存集合构造RDD8.5 读取外部存储数据,构造RDD9. …