SQL语言的3种分类

SQL 表连接

在sql中表连接方式有left join (左连接)；rith join(右连接);inner join(内连接)；full join(全连接)；union all （上下拼接） union （上下去重拼接） left join (左连接): 左连接是将左表作为底层表…

sql注入手法详解

sql定义 sql--结构化查询语句 sql注入：首先我们通过前端将我们的payload(恶意代码)传送到后台服务器传送到后台以后我们提交的payload拼接到sql语句中作为sql语句的一部分被执行从而导致数据库又被脱库甚至删库的风险使得数据库受损 sql注入手法 sql注入可…

--1、GETDATE()获取当前日期 SELECT GETDATE() --2、DAY|MONTH|YEAR 函数返回指定日期所在日/月/年的部分 SELECT YEAR(GetDate()) as 年; SELECT MONTH(GetDate()) as 月; SELECT DAY(GetDate()) as 日; --3、DATENAME函数返回指定日期的指定部分,返回字符串。获取年、月…

SQL行列转换

常见的行列转换包括以下四种情况： 1.列转行 2.行转列 3.列转换成字符串 4.字符串转换成列 1.列转行导入数据 DROP TABLE IF EXISTS t_student; CREATE TABLE t_student (id int(20) NOT NULL AUTO_INCREMENT COMMENT 主键 id,name varchar(50) DEFAULT NULL COMM…

【spark】RDD数据源

1、普通文本文件 sc.textFile("./dir/*.txt") 如果传递目录，则将目录下的所有文件读取作为RDD。文件路径支持通配符。但是这样对于大量的小文件读取效率并不高，应该使用wholeTextFiles def wholeTextFiles(path: String, minPartitions: …

pyspark：RDD和DataFrame

作为数据挖掘工程师，以后必不可免要用到并行计算，pyspark是python操作spark的API，本人因此入了坑。 1 pyspark的安装见我另一篇博客：https://blog.csdn.net/qq_23860475/article/details/90476197 2 spark概述 Spark 允许用户读…

Spark 入门 RDD操作

Spark版本: 3.1.3 RDD 支持两种类型的操作： 转换操作(transformations): 从现有数据集创建一个新数据集动作操作(actions): 在数据集上进行计算后将值返回给 Driver 例如，map 是一个转换操作，将数据集每个元素传递给一个函数并返回一个新 R…

Spark之RDD算子

🐱今天出一期spark系列的硬货，即RDD算子，所谓算子，就是对某些事物的操作，或者说是方法。本期主要介绍几十个RDD算子，根据他们的特点，逐一进行介绍，有关spark的往期内容大家可以查看下…

Spark RDD之Partition

概要 Spark RDD主要由Dependency、Partition、Partitioner组成，Partition是其中之一。一份待处理的原始数据会被按照相应的逻辑(例如jdbc和hdfs的split逻辑)切分成n份，每份数据对应到RDD中的一个Partition，Partition的数量决定了task的数量&…

【spark】RDD-API

一、创建RDD 1.由外部存储系统的数据集创建，由外部存储系统的数据集创建，包括本地的文件系统，还有所有Hadoop支持的数据集，比如HDFS、Cassandra、HBase等 val rdd1 sc.textFile("hdfs://node01:8020/wordcount/input/word…

【大数据】Spark弹性分布式数据集RDD详细说明

文章目录整体介绍一、定义与特性二、操作与转换三、存储级别与持久化四、依赖关系与容错机制五、优化与性能调优常见操作支持的数据格式1.文本文件 (Text Files)2. CSV 文件3. JSON 文件4. Parquet 文件5. Sequence Files6.Hadoop文件读取A. 读取HDFS上的文本文件B. 使用Hado…

Spark RDD算子

RDD算子 RDD被创建后是只读的，不允许修改。Spark提供了丰富的用于操作RDD的方法，这些方法被称为算子。一个创建完成的RDD只支持两种算子：转化（Transformation）算子和行动（Action）算子。转…

RDD编程初级实践

目录一、实验目的二、实验内容1. 熟悉RDD编程2. pySpark交互式编程3. 编写独立应用程序一、实验目的熟悉Spark的RDD基本操作及键值对操作；熟悉使用RDD编程解决实际具体问题的方法。二、实验内容 1. 熟悉RDD编程转换操作 filter(func)操作会筛选出满足函数fu…

RDD实现

解析器集成 Scala解析器处理一般过程： 1 将用户输入每一行编译成一个类 2 将该类载入到JVM中 3 调用该类中的某个函数内存管理 1 未序列化Java对象存储在内存中 2 序列化的数据存于内存中 3 存于磁盘中内存使用LRU(最近最少)回收算法管理 RDD编程接口 1 RD…

PySpark RDD操作

前提条件： 1、拥有Ubuntu16.04环境 2、Ubuntu下安装好Spark和PySpark 题目一：RDD创建首先进入pyspark命令行 $ pyspark （1）从文件中加载从本地文件创建RDD >>> lines sc.textFile("file:///home/hadoop/da…

RDD的创建方式

RDD的创建方式 1. 实验室名称：2. 实验项目名称：3. 实验学时：4. 实验原理：5. 实验目的：6. 实验内容：7. 实验器材（设备、虚拟机名称）：8. 实验步骤：8.1 启动Spark集群8.2 启动zeppelin服务器8.3 创建notebook文档8.4 从内存集合构造RDD8.5 读取外部存储数据，构造RDD9. …

RDD分区理解

RDD分区的作用一个HDFS文件的RDD将文件的每个文件块表示为一个分区，并且知道每个文件块的位置信息。这些对应着数据块的分区分布到集群的节点中，因此，分区的多少涉及对这个RDD进行并行计算的粒度。首先，分区是一个逻辑概念&…

spark数据处理-RDD

文章目录 spark数据处理笔记spark核心介绍RDD编程RDD介绍-弹性分布式数据集创建RDD两种方式函数传递常见RDD转化操作和行动操作常用的转化操作：类集合操作行动操作不同RDD类型间转化持久化（缓存）键值对RDD操作创建Pair RDD转化操作单RDD操作…

Spark——RDD操作详解

转载自：https://blog.csdn.net/zhaojw_420/article/details/53261965 一、基本RDD 1、针对各个元素的转化操作最常用的转化操作是map()和filter()。转化操作map()J接收一个函数，把这个函数用于RDD中的每一个元素，将函数的返回结果作为结果…

RDD原理

RDD概念RDD的内部属性一组分片（Partition），即数据集的基本组成单位计算每个分片的函数RDD之间的依赖关系一个Partitioner，即RDD的分片函数分区列表，存储存取每个Partition的优先位置（preferred location&a…

相关文章

SQL 表连接

sql注入手法详解

SQLserver常用时间函数

SQL行列转换

【spark】RDD数据源

pyspark：RDD和DataFrame

Spark 入门 RDD操作

Spark之RDD算子

Spark RDD之Partition

【spark】RDD-API

【大数据】Spark弹性分布式数据集RDD详细说明

Spark RDD算子

RDD编程初级实践

RDD实现

PySpark RDD操作

RDD的创建方式

RDD分区理解

spark数据处理-RDD

Spark——RDD操作详解

RDD原理