padluo(25)•in #cn•2745 days ago从用户连续活跃的最大天数说起问题引入 最近经常碰到这样的问题,每天每个城市播放最多的10首歌,某月每支股票连续下跌/上涨的最大天数,用户连续活跃的最大天数,初步看起来都和分析函数相关,考验逻辑思维和写复杂SQL的能力。 以用户连续活跃的最大天数为例 以Oracle的分析函数语法说明,首先模拟一些用户活跃的数据, -- 建表语句 DROP TABL...12$0.00padluo(25)•in cn•2745 days ago从用户连续活跃的最大天数说起问题引入 最近经常碰到这样的问题,每天每个城市播放最多的10首歌,某月每支股票连续下跌/上涨的最大天数,用户连续活跃的最大天数,初步看起来都和分析函数相关,考验逻辑思维和写复杂SQL的能力。 以用户连续活跃的最大天数为例 以Oracle的分析函数语法说明,首先模拟一些用户活跃的数据, -- 建表语句 DROP TABL...12$0.00
padluo(25)•in #cn•2763 days agoSeries和DataFrame的数据取值与选择数据取值与选择 NumPy数据取值的方法,包括取值操作(如arr[2, 1])、切片操作(如arr[:, 1:5])、掩码操作(如arr[arr > 0])、花哨的索引操作(如arr[0, [1, 5]]),以及组合操作(如arr[:, [1, 5]])。 在NumPy的二维数组里,data[0]返回第一行,而在Dat...43$0.00padluo(25)•in cn•2763 days agoSeries和DataFrame的数据取值与选择数据取值与选择 NumPy数据取值的方法,包括取值操作(如arr[2, 1])、切片操作(如arr[:, 1:5])、掩码操作(如arr[arr > 0])、花哨的索引操作(如arr[0, [1, 5]]),以及组合操作(如arr[:, [1, 5]])。 在NumPy的二维数组里,data[0]返回第一行,而在Dat...43$0.00
padluo(25)•in #cn•2801 days agoSpark实战(6)_spark-sql -e -f -i命令的整合和spark-sql日常作业开发流程总结背景介绍 在日常工作中,我们可以在一个shell脚本里面利用spark-sql -e执行sql脚本,而且可以传参数,但是存在一个问题,shell脚本对格式要求严格,而且shell脚本和spark-sql的脚本混在一起,内容庞大凌乱,不好管理。而spark-sql -f可以执行一个hql文件,但是不能传参数进去,这就引出...0$0.00padluo(25)•in cn•2801 days agoSpark实战(6)_spark-sql -e -f -i命令的整合和spark-sql日常作业开发流程总结背景介绍 在日常工作中,我们可以在一个shell脚本里面利用spark-sql -e执行sql脚本,而且可以传参数,但是存在一个问题,shell脚本对格式要求严格,而且shell脚本和spark-sql的脚本混在一起,内容庞大凌乱,不好管理。而spark-sql -f可以执行一个hql文件,但是不能传参数进去,这就引出...0$0.00
padluo(25)•in #cn•2815 days agoSpark实战(5)_Spark Core核心编程Spark版本 cdh5.9.0集成的spark的版本1.6.0,集成的hadoop版本2.6.0。查看的网址: http://archive.cloudera.com/cdh5/redhat/6/x8664/cdh/5.9.0/ 如果用cdh5.9.0 parcels离线安装自带的spark(on yarn),启动时...22$0.01padluo(25)•in cn•2815 days agoSpark实战(5)_Spark Core核心编程Spark版本 cdh5.9.0集成的spark的版本1.6.0,集成的hadoop版本2.6.0。查看的网址: http://archive.cloudera.com/cdh5/redhat/6/x8664/cdh/5.9.0/ 如果用cdh5.9.0 parcels离线安装自带的spark(on yarn),启动时...22$0.01
padluo(25)•in #cn•2820 days agoScala的Class、Object、Trait开发环境 ideaIU或ideaIC。 idea的scala插件,File-Setting-Plugins,搜索scala在线安装,或下载后离线安装Install plugin from disk。 加载scala的包,Project Structure,Global Libraries,添加scala-sdk。 基础...10$0.00padluo(25)•in cn•2820 days agoScala的Class、Object、Trait开发环境 ideaIU或ideaIC。 idea的scala插件,File-Setting-Plugins,搜索scala在线安装,或下载后离线安装Install plugin from disk。 加载scala的包,Project Structure,Global Libraries,添加scala-sdk。 基础...10$0.00
padluo(25)•in #cn•2825 days agoSpark实战(4)_Master原理剖析与源码分析主备切换机制原理剖析 Master可以配置两个,Spark原生的standalone模式支持Master主备切换。 Spark Master主备切换可以基于两种机制,一种是基于文件系统的,一种是基于ZooKeeper的,基于文件系统的主备切换机制,需要在Active Master挂掉之后,手动去切换到Standby M...41$0.00padluo(25)•in cn•2825 days agoSpark实战(4)_Master原理剖析与源码分析主备切换机制原理剖析 Master可以配置两个,Spark原生的standalone模式支持Master主备切换。 Spark Master主备切换可以基于两种机制,一种是基于文件系统的,一种是基于ZooKeeper的,基于文件系统的主备切换机制,需要在Active Master挂掉之后,手动去切换到Standby M...41$0.00
padluo(25)•in #cn•2826 days agoSpark实战(3)_SparkContext原理剖析与源码分析TaskScheduler的初始化机制 TaskScheduler,如何注册Application,executor如何反向注册? 1. createTaskScheduler(),内部会创建三个东西。 2. 一是TaskSchedulerImpl,它其实就是我们所说的TaskScheduler。 3. 二是Spark...50$0.00padluo(25)•in cn•2826 days agoSpark实战(3)_SparkContext原理剖析与源码分析TaskScheduler的初始化机制 TaskScheduler,如何注册Application,executor如何反向注册? 1. createTaskScheduler(),内部会创建三个东西。 2. 一是TaskSchedulerImpl,它其实就是我们所说的TaskScheduler。 3. 二是Spark...50$0.00
padluo(25)•in #cn•2829 days agoSpark实战(2)_Spark内核架构剖析Standalone模式 1. 提交Spark应用的机器,Application(自己的Spark程序),spark-submit(shell)提交Application。 2. Driver(启动一个进程),spark-submit使用Standalone模式提交Application的时候,其实会通过反射的方式,(...31$0.00padluo(25)•in cn•2829 days agoSpark实战(2)_Spark内核架构剖析Standalone模式 1. 提交Spark应用的机器,Application(自己的Spark程序),spark-submit(shell)提交Application。 2. Driver(启动一个进程),spark-submit使用Standalone模式提交Application的时候,其实会通过反射的方式,(...31$0.00
padluo(25)•in #cn•2859 days agoScala学习笔记05_面向对象编程之类和对象定义一个简单的类 // 定义类,包含field及方法 scala> :paste // Entering paste mode (ctrl-D to finish) class HelloWorld { private var name = "leo" def sayHello() {print("Hello, " +...41$0.00padluo(25)•in cn•2859 days agoScala学习笔记05_面向对象编程之类和对象定义一个简单的类 // 定义类,包含field及方法 scala> :paste // Entering paste mode (ctrl-D to finish) class HelloWorld { private var name = "leo" def sayHello() {print("Hello, " +...41$0.00
padluo(25)•in #cn•2860 days agoScala学习笔记04_Map与Tuple创建Map // 创建一个不可变的Map scala> val ages = Map("Leo" -> 30, "Jen" -> 25, "Jack" -> 23) scala> val ages = Map("Leo" -> 30, "Jen" -> 25, "Jack" -> 23) ages: scala.col...10$0.00padluo(25)•in cn•2860 days agoScala学习笔记04_Map与Tuple创建Map // 创建一个不可变的Map scala> val ages = Map("Leo" -> 30, "Jen" -> 25, "Jack" -> 23) scala> val ages = Map("Leo" -> 30, "Jen" -> 25, "Jack" -> 23) ages: scala.col...10$0.00
padluo(25)•in #cn•2861 days agoScala学习笔记03_数组Array Array,长度不可改变的数组,Scala数组的底层实际上是Java数组,如字符串数组在底层就是Java的String[],整数数组在底层就是Java的Int[]。 Scala // 数组初始化后,长度就固定下来了,而且元素全部根据其类型初始化 scala> val a = new ArrayInt a: ...20$0.00padluo(25)•in cn•2861 days agoScala学习笔记03_数组Array Array,长度不可改变的数组,Scala数组的底层实际上是Java数组,如字符串数组在底层就是Java的String[],整数数组在底层就是Java的Int[]。 Scala // 数组初始化后,长度就固定下来了,而且元素全部根据其类型初始化 scala> val a = new ArrayInt a: ...20$0.00
padluo(25)•in #cn•2862 days agoScala学习笔记02_函数入门函数入门 函数的定义与调用,在Scala中定义函数时,需要定义函数的函数名、参数、函数体。 scala> :paste // Entering paste mode (ctrl-D to finish) def sayHello(name:String, age:Int) = { if(age >= 18) { pri...10$0.00padluo(25)•in cn•2862 days agoScala学习笔记02_函数入门函数入门 函数的定义与调用,在Scala中定义函数时,需要定义函数的函数名、参数、函数体。 scala> :paste // Entering paste mode (ctrl-D to finish) def sayHello(name:String, age:Int) = { if(age >= 18) { pri...10$0.00
padluo(25)•in #cn•2863 days agoScala学习笔记01_条件控制与循环if表达式 if表达式的定义,if表达式是有值的,就是if或else中最后一行语句返回的值。 scala> val age = 30 age: Int = 30 scala> val isAdult = if(age > 18) 1 else 0 isAdult: Int = 1 if表达式的类型推断,if和else子...31$0.00padluo(25)•in cn•2863 days agoScala学习笔记01_条件控制与循环if表达式 if表达式的定义,if表达式是有值的,就是if或else中最后一行语句返回的值。 scala> val age = 30 age: Int = 30 scala> val isAdult = if(age > 18) 1 else 0 isAdult: Int = 1 if表达式的类型推断,if和else子...31$0.00
padluo(25)•in #cn•2884 days ago分布式消息队列Kafka学习笔记Kafka概述 > a distributed streaming platform Kafka架构和核心概念 producer, 生产者,生产馒头。 consumer, 消费者,吃馒头。 broker, 篮子。 topic, 主题,给馒头带一个标签,topica的馒头是给你吃的,topicb的馒头是给你弟弟吃。 Zo...21$0.00padluo(25)•in cn•2884 days ago分布式消息队列Kafka学习笔记Kafka概述 > a distributed streaming platform Kafka架构和核心概念 producer, 生产者,生产馒头。 consumer, 消费者,吃馒头。 broker, 篮子。 topic, 主题,给馒头带一个标签,topica的馒头是给你吃的,topicb的馒头是给你弟弟吃。 Zo...21$0.00
padluo(25)•in #cn•2886 days ago分布式日志收集框架Flume学习笔记业务现状分析 我们有很多servers和systems,比如network device、operating system、web server、Application,他们会产生日志和其他数据,如何使用这些数据呢?可以把源系统的日志数据移到分布式的存储和计算框架上处理,如何解决? - shell cp hadoop集...44$0.00padluo(25)•in cn•2886 days ago分布式日志收集框架Flume学习笔记业务现状分析 我们有很多servers和systems,比如network device、operating system、web server、Application,他们会 产生日志和其他数据,如何使用这些数据呢?可以把源系统的日志数据移到分布式的存储和计算框架上处理,如何解决? - shell cp hadoop集...44$0.00
padluo(25)•in #cn•2889 days ago与iPhone5国行A1429的故事:越狱、降级刷机、完美电信3G、不完美电信4G、撸油管自从上次把小米3全网通版刷了安卓原生系统,干净清爽的一B,装上了G家全家桶,焕发了第二春,可以再战几年,唯一缺点就是不能用4G。 你需要一个原生的安卓 这次再深入研究了一下苹果的iPhone 5。 应用场景 作为电信卡(3G/4G)的备用机,可以电话、短信、科学上网。 测试设备:iPhone5国行A1429,理论上适合...22$0.00padluo(25)•in cn•2889 days ago与iPhone5国行A1429的故事:越狱、降级刷机、完美电信3G、不完美电信4G、撸油管自从上次把小米3全网通版刷了安卓原生系统,干净清爽的一B,装上了G家全家桶,焕发了第二春,可以再战几年,唯一缺点就是不能用4G。 你需要一个原生的安卓 这次再深入研究了一下苹果的iPhone 5。 应用场景 作为电信卡(3G/4G)的备用机,可以电话、短信、科学上网。 测试设备:iPhone5国行A1429,理论上适合...22$0.00
padluo(25)•in #cn•2905 days agoFlume+Kafka+Storm模拟应用日志的实时处理模拟应用需求 - 采集订单系统应用打印的日志文件。 日志文件使用log4j生成,滚动生成。使用tail -F xxx.log来监控文件名称,理解tail -f和tail -F的区别。 - 将采集的日志文件保存到Kafka中。 (source)输入:tail -F xxx.log (channel)存储:内存 (sink...77$0.29padluo(25)•in cn•2905 days agoFlume+Kafka+Storm模拟应用日志的实时处理模拟应用需求 - 采集订单系统应用打印的日志文件。 日志文件使用log4j生成,滚动生成。使用tail -F xxx.log来监控文件名称,理解tail -f和tail -F的区别。 - 将采集的日志文件保存到Kafka中。 (source)输入:tail -F xxx.log (channel)存储:内存 (sink...77$0.29