App +
- 2015-04-29在线画图网站
BI +
- 2015-07-04数据仓库与数据集市的区别
BigData +
Blog +
Database +
- 2015-12-09图数据库neo4j安装使用(2.2.7)
- 2015-08-07MySQL时间戳字段在INSERT和UPDATE时都自动更新
- 2015-05-09MySQL常见操作
- 2015-05-05MySQL技巧
- 2014-11-15MySQL允许远程连接
Docker +
- 2016-08-20在CentOS7上安装kubernetes
- 2016-08-14Docker Machine安装及基本操作(0.7)
- 2016-08-14使用Docker Swarm构建Overlay网络实现跨主机的容器网络互通(1.12)
- 2016-08-13Docker Swarm基本操作(1.12)
- 2016-08-04Docker安装与基本操作(CentOS7)
- 2015-05-09Docker文档列表
ETL +
- 2015-08-07ETL增量数据抽取方案(传送门)
- 2015-08-06主要ETL工具对比(传送门)
- 2015-08-05使用Logstash+Redis+ElasticSearch+Kibana分析nginx日志
- 2015-08-05[Logstash][安装]和[基本使用](1.5.3)
- 2015-07-21Sqoop2架构与功能说明(1.99.3)
- 2015-07-21Sqoop2命令行和REST接口使用(1.99.3)
- 2015-07-20Sqoop2软件安装使用(1.99.3)
- 2015-07-03Flume与Kafka集成(1.6.0+0.8.2.1)
- 2015-06-27Flume的安装使用(1.6)
- 2015-06-01Sqoop从MySQL导出数据到Hive和HBase(1.4.5)
- 2015-05-13Sqoop2软件安装使用(1.99.6)
- 2015-02-27Sqoop软件安装使用(1.4.5)
HDFS +
- 2015-11-16[特性]HDFS ACL使用
- 2015-08-16HDFS常用命令
Hadoop +
- 2016-03-20常用的Hadoop测试程序和Benchmark(2.7.1)
- 2015-12-17Apache Kylin安装使用
- 2015-12-11[特性]Hive使用GBK等非UTF8字符集
- 2015-11-22Zookeeper日志输出修改
- 2015-11-21[安装]HBase版本更新
- 2015-11-21[安装]Hive版本更新
- 2015-11-17Hadoop配置Kerberos认证(2.7.1)
- 2015-11-15[特性]Hive使用UDF
- 2015-11-14[特性]Hive桶功能使用
- 2015-11-14[特性]Hive分区功能使用
- 2015-11-11Hive常用操作
- 2015-11-04HDFS分级存储Archival Storage(2.7.1)
- 2015-10-28使用zkdash管理Zookeeper
- 2015-10-20Hadoop版本升级步骤(2.6.1->2.7.1)
- 2015-09-30Hadoop版本升级步骤(2.4.1->2.6.1)
- 2015-09-29HBase对使用Snappy压缩的表进行Bulkload
- 2015-09-24Yarn关键配置参数说明
- 2015-09-16HDFS配额管理(2.4.1)
- 2015-09-16Hive支持的文件格式与压缩算法(1.2.1)
- 2015-09-15Hadoop源码编译(2.4.1)
- 2015-09-15Hadoop和HBase安装snappy压缩库(2.4.1)
- 2015-09-14Hive外部表使用
- 2015-08-09使用Hive分析CSDN泄露的用户数据
- 2015-08-05[ElasticSearch][集群模式安装](1.7.1)
- 2015-08-05[ElasticSearch][使用](1.7.1)
- 2015-08-04[ElasticSearch][安装](1.7.1)
- 2015-08-04[安装]SparkSQL安装(1.3.1)
- 2015-07-29Kafka常用命令
- 2015-07-28SolrCloud安装(5.2.1)
- 2015-07-27Impala介绍
- 2015-07-26使用Zookeeper实现应用的主备/分布式服务(传送门)
- 2015-07-25Hive WebHCat安装(1.0.0)-测试未成功
- 2015-07-22Zookeeper开启Rest服务(3.4.6)
- 2015-07-15Hadoop小文件问题及解决方案
- 2015-07-05Solr安装使用(5.2.1)
- 2015-06-27HDFS安全模式介绍
- 2015-06-11大数据技术全貌
- 2015-05-31使用BulkLoad批量导入数据到HBase中
- 2015-05-29Hive常见问题
- 2015-05-28HDFS DistCp命令使用
- 2015-05-27查询已格式化HDFS集群的Cluster ID
- 2015-05-27在NameNode HA的基础上部署HDFS Federation
- 2015-05-27HDFS快照操作使用
- 2015-05-26HDFS NameNode HA部署(Quorum Journal Manager方案)
- 2015-05-26HDFS Web UI使用
- 2015-05-25WebHDFS与HttpFS的使用
- 2015-05-22使用Ganglia监控Hadoop
- 2015-05-13Hue安装指南
- 2015-05-12Hive on HBase部署使用(1.00)
- 2015-05-12[特性]Hive的视图和索引
- 2015-05-08[API]使用Java API访问Hive
- 2015-05-07Hive TRANSFORM示例
- 2015-05-07Hive SQL使用指南(4)——检索数据
- 2015-05-07Hive遗留问题
- 2015-05-07Hive SQL使用指南(3)——导入导出数据
- 2015-05-06Hive原理
- 2015-05-06[API]使用Python API访问Hive
- 2015-05-05Hive的几种部署模式介绍
- 2015-05-05Hive SQL使用指南(2)——表操作
- 2015-05-05Hive SQL使用指南(1)——数据库操作
- 2015-05-04Ambari使用入门(CentOS 6)
- 2015-04-30HBase命名空间Namespace
- 2015-04-14Hive使用Parquet文件格式(1.00)
- 2015-04-09HBase基本原理介绍(0.98)
- 2015-04-08HBase Shell命令使用(0.98)
- 2015-03-09Phoenix安装使用(4.2.2)(未完成)
- 2015-02-27OOzie软件安装使用(4.0.1)(未完成)
- 2015-02-26Pig软件安装(0.14.0)
- 2015-02-25[安装]Hive远程模式安装(1.00)
- 2015-02-14Hive单节点安装使用(1.00)
- 2015-02-14HBase安装使用(0.98)
- 2015-02-14Zookeeper分布式模式安装使用(3.4.6)
- 2015-02-13使用命令行编译打包运行自己的MapReduce程序(2.4.1)
- 2015-02-12通过Java API操作HDFS上的文件(2.4.1)
- 2015-02-12Hadoop客户端软件安装(2.4.1)
- 2015-02-12Hadoop集群模式安装(2.4.1)
Hive +
- 2016-02-02Hive性能优化(1.2.1)(未完成)
- 2016-02-01Hive on Spark使用(1.2.1,1.3.1)(待测试)
- 2016-01-31[特性]Hive动态分区功能使用
Kafka +
- 2016-04-24增加Kafka Topic的分区复本数(0.8.2.1)
- 2016-04-24Kafka Topic无法删除问题的定位过程(0.8.2.1)
Linux +
- 2016-08-05CentOS7常用操作
- 2016-05-21Linux集群管理工具ansible使用方法
- 2016-05-21使用at命令设定一次性定时任务
- 2016-05-14使用parted划分GPT分区
- 2016-04-20CentOS下手工创建Redis集群(3.0.4)
- 2016-03-30Linux工具dsh使用
- 2016-03-17使用Wireshark分析Redis通信协议
- 2016-03-16XShell工具配置
- 2016-01-21CentOS下Redis集群模式安装(3.0.4)
- 2015-11-24常用Shell操作及技巧
- 2015-11-24CentOS下安装LDAP服务(2.4以下版本)
- 2015-11-23解决SSH登录时出现Warning: Permanently added告警问题
- 2015-11-17Kerberos服务器安装
- 2015-11-04ssh远程登录执行复杂命令的方法
- 2015-10-28CentOS 6.x安装Python 2.7总结
- 2015-09-03Linux下的压缩打包工具——zip、tar、tar.gz、tar.bz2对比
- 2015-09-03CentOS上用yum安装rar/unrar
- 2015-09-01CentOS下安装PPTP客户端
- 2015-08-08sed处理文本文件
- 2015-08-05定制nginx的日志格式
- 2015-07-25Bash快捷键
- 2015-07-22vim常用操作备忘
- 2015-07-22CentOS下Redis的安装使用
- 2015-04-08vim设定文件扩展名语法解析规划
- 2015-02-28nginx配置301域名重定向
- 2015-02-17Shell脚本处理JSON数据工具jq
- 2015-02-12CentOS OpenVPN客户端连接配置
- 2014-10-10CentOS下RabbitMQ的安装与使用
- 2014-10-10使用nginx的proxy_store缓存文件加速访问速度
- 2014-10-04nginx中禁止未定义域名访问
- 2014-10-04使用Dropbox Uploader自动备份站点数据到Dropbox
- 2014-10-01chkconfig中添加自启动服务
- 2014-09-30进程管理工具Supervisor的使用
Programming +
- 2017-03-12Java Web开发最佳实践
- 2016-11-18使用ElasticSearch为本博客做全文检索(未完成)
- 2016-11-18使用Python操作SQLite
- 2016-03-27Maven安装和使用(3.3.9)
- 2015-09-08Scala的柯里化语法
- 2015-09-07vim配置Scala语法高亮
- 2015-08-28JVM内存结构与GC剖析
- 2015-08-26Scala 正则表达式(传送门)
- 2015-04-27Scala学习笔记
- 2015-04-27Scala连接MySQL数据库
- 2015-03-17Learn Scala in Y minutes
Python +
- 2016-01-31Django中业务逻辑处理完成后返回请求的页面
- 2016-01-16使用python-markdown将markdown转为html
- 2016-01-10相关爬虫软件列表
- 2015-11-15Django基本使用
- 2015-05-25使用Python格式化json
- 2015-05-14Python pip软件安装
- 2015-03-06Django全局变量实现方式
- 2014-10-30Django中实现自动分页
- 2014-10-29Python虚拟环境
- 2014-10-29Python环境完全使用UTF配置
- 2014-10-23Python打印类的属性列表
- 2014-10-22CentOS下Python从2.6.6升级到2.7版本
- 2014-10-11Python语言技巧
Solr +
Solution +
Spark +
- 2015-09-17Spark去掉文本文件首行(表头)
- 2015-09-02Spark Partitioner使用
- 2015-08-31搭建Spark源码阅读环境
- 2015-08-27Spark on Yarn内存参数设置(传送门)
- 2015-08-27一次Spark应用程序参数优化案例
- 2015-08-25Spark API使用实例(1)
- 2015-08-20使用SparkSQL分析CSDN泄露的用户数据
- 2015-08-20Spark-Shell中禁用日志打印
- 2015-08-19使用Spark分析泄露的2000W开房数据
- 2015-08-12Spark性能优化——API使用(传送门)
- 2015-08-11Spark executor内存配置参数优先级
- 2015-08-07使用Spark分析CSDN泄露的用户数据
- 2015-08-07Spark MLlib入门实例K-means
- 2015-06-24Spark性能优化(2)——广播变量、本地缓存目录、RDD操作、数据倾斜
- 2015-06-23Spark性能优化(1)——序列化、内存、并行度、数据存储格式、Shuffle
- 2015-05-21Spark DataFrame使用(1.3.1 & Python)
- 2015-04-25Spark序列化与压缩
- 2015-04-24Spark相关文档链接
- 2015-04-24Spark广播变量与累加器
- 2015-04-24Spark操作SequenceFile
- 2015-04-23Spark Windows开发环境搭建(1.3.0)
- 2015-04-15Spark任务调度
- 2015-04-15Spark任务运行机制
- 2015-04-14Spark SQL操作Parquet文件(1.2)
- 2015-04-09Spark三种属性配置方式
- 2015-03-20Spark Streaming updateStateByKey用法(计算累加值)
- 2015-03-16Spark SQL实例(1.2.1)
- 2015-03-13使用spark-submit运行Spark程序
- 2015-03-12Spark RDD API实例
- 2015-03-12Spark应用开发实例
- 2015-03-06Spark History Server安装(1.2.1)
- 2015-03-05Spark的四种运行模式(1.2.1)
- 2015-03-04Spark软件安装使用(1.2.1)
Spark-API +
- 2015-08-25Spark函数之name、setName等(一大波)
- 2015-08-24Spark函数之map、mapPartitions、mapPartitionsWithContext和mapPartitionsWithIndex
- 2015-08-24Spark函数之id、keyBy、keys、values和lookup
- 2015-08-24Spark函数之histogram等数学函数
- 2015-08-21Spark函数之groupBy和groupByKey
- 2015-08-21Spark函数之glom
- 2015-08-21Spark函数之persist、unpersist、cache和getStorageLevel
- 2015-08-21Spark函数之join、leftOuterJoin、rightOuterJoin和fullOuterJoin
- 2015-08-21Spark函数之foreach和foreachPartition
- 2015-08-21Spark函数之fold和foldByKey
- 2015-08-21Spark函数之mapValues和flatMapValues
- 2015-08-21Spark函数之map和flatMap
- 2015-08-21Spark函数之filter
- 2015-08-21Spark函数之distinct和first
- 2015-08-21Spark函数之dependencies
- 2015-08-21Spark函数之countApproxDistinct和countApproxDistinctBy
- 2015-08-21Spark函数之count、countByKey和countByValue
- 2015-08-21Spark函数之combineByKey
- 2015-08-21Spark函数之zip、zipParititions、zipWithIndex和zipWithUniqueId
- 2015-08-20Spark函数之collect、toArray和collectAsMap
- 2015-08-20Spark函数之cogroup和groupWith
- 2015-08-20Spark函数之coalesce和repartition
- 2015-08-20Spark函数之checkpoint、getCheckpointFile和setCheckpointDir
- 2015-08-20Spark函数之cartesian
- 2015-08-20Spark函数之aggregateByKey
- 2015-08-20Spark函数之aggregate
Streaming +
- 2015-10-19Kafka Manager安装使用
- 2015-08-02对七牛Flume+Kafka+SparkStreaming实践经验的总结
- 2015-07-30Kafka分布式消息系统原理
- 2015-07-24Storm命令行
- 2015-07-23Storm技术介绍
- 2015-07-03Flume与+Kafka+Spark Streaming集成(1.6.0+0.8.2.1+1.3.1)
- 2015-07-02Kafka与Spark Streaming集成(0.8.2.1+1.3.1)
- 2015-05-14使用Pyleus开发Storm应用程序(0.9.4)
- 2015-05-14Storm集群方式运行(0.9.4)
- 2015-05-14Storm集群部署(0.9.4)
- 2015-03-20Kafka分布式消息系统安装使用(0.8.2.1)
- 2015-03-19Spark Streaming实例(1.2.1)
Yarn +
- 2016-01-26Yarn的ResourceManager配置HA(2.7.1)
- 2015-10-28Yarn的基于标签转发策略Label-based Scheduling(2.7.1)
- 2015-09-29Yarn调度器学习总结
239+