大数据书单(100本)
大数据书单(100本)
序号 书名 作者 出版社
1 Hadoop权威指南:大数据的存储与分析(第4版)(修订版)(升级版) Tom White 清华大学出版社
2 Hive编程指南 卡普廖洛 (Edward Capriolo) / 万普勒 (Dean Wampler) / 卢森格林 (Jason Rutherglen) / 曹坤 人民邮电出版社
3 Hive性能调优实战 林志煌 机械工业出版社
4 大数据Hive离线计算开发实战 杨力 人民邮电出版社
5 HBase权威指南 [美] Lars George / 代志远 / 刘佳 / 蒋杰 东南大学出版社
6 HBase原理与实践 胡争 / 范欣欣 机械工业出版社
7 ZooKeeper : Distributed process coordination Flavio Junqueira / Benjamin Reed O’Reilly Media
8 Kafka权威指南 Neha Narkhede / Gwen Shapira / Todd Palino / 薛命灯 人民邮电出版社
9 深入理解Kafka与Pulsar:消息流平台的实践与剖析 梁国斌 电子工业出版社
10 Scala编程(第3版) 【德】Martin Odersky(马丁.奥德斯基) / 【美】Lex Spoon(莱·斯彭) / 【美】Bill Venners(比尔·凡纳斯) 电子工业出版社
11 Spark权威指南 Bill Chambers / Matei Zaharia 中国电力出版社
12 大数据处理框架Apache Spark设计与实现(全彩) 许利杰 / 方亚芬 电子工业出版社
13 图解Spark:核心技术与案例实战 郭景瞻 电子工业出版社
14 Spark SQL内核剖析 朱锋 / 张韶全 / 黄明 电子工业出版社
15 Spark快速大数据分析 [美] Holden Karau / [美] Andy Konwinski / [美] Patrick Wendell / [加] Matei Zaharia 人民邮电出版社
16 数据算法 : Hadoop/Spark大数据处理技巧 Mahmoud Parsian / 苏金国 / 杨健康 中国电力出版社
17 Spark实时大数据分析 基于Spark Streaming框架 [美] 祖贝尔·纳比 著,王胜夏,景玉 译 清华大学出版社
18 Flink基础教程 [美] 埃伦•弗里德曼 / [希] 科斯塔斯•宙马斯 人民邮电出版社
19 Flink核心技术 : 源码剖析与特性开发 黄伟哲 人民邮电出版社
20 Flink大数据分析实战 张伟洋 清华大学出版社
21 大数据技术原理与应用(第3版) : 概念、存储、处理、分析与应用 林子雨 人民邮电出版社
22 数据仓库 : (原书第4版) 荫蒙 / 王志海 机械工业出版社
23 数据仓库工具箱(第3版) : 维度建模权威指南 Ralph Kimball / Margy Ross / 王念滨 / 周连科 / 韦正现 清华大学出版社
24 DW2.0 : 下一代数据仓库的构架 W. H. Inmon / Derek Strauss / Genia Neushloss / 王志海 / 王建林 / 付彬 / 武婷婷 机械工业出版社
25 大数据分析 : 数据仓库项目实战 尚硅谷IT教育 电子工业出版社
26 Flume : 构建高可用、可扩展的海量日志采集系统 【美】Hari Shreedharan(哈里•史瑞德哈伦) / 马延辉 / 史东杰 电子工业出版社
27 ELK stack权威指南 饶琛琳 机械工业出版社
28 ClickHouse原理解析与应用实践 朱凯 机械工业出版社
29 ClickHouse性能之巅:从架构设计解读性能之谜 陈峰 机械工业出版社
30 高效使用Greenplum : 入门、进阶与数据中台 王春波 机械工业出版社
31 大数据架构师指南 朱进云 / 陈坚 / 王德政 清华大学出版社
32 大数据之路 : 阿里巴巴大数据实践 阿里巴巴数据技术及产品部 电子工业出版社
33 大数据架构和算法实现之路:电商系统的技术实战 黄申 机械工业出版社
34 大数据平台架构与原型实现:数据中台建设实战 耿立超 电子工业出版社
35 云原生数据中台:架构、方法论与实践 彭锋 / 宋文欣 / 孙浩峰 机械工业出版社
36 数字化转型架构:方法论与云原生实践 王思轩 电子工业出版社
37 用户画像:方法论与工程化解决方案 赵宏田 机械工业出版社
38 dataops实践手册 : 敏捷精益的数据运营 [美]哈文德.阿特瓦尔 / 马欢 机械工业出版社
39 运营之路 数据分析+数据运营+用户增长(新时代·营销新理念) 徐小磊 清华大学出版社
40 商业分析全攻略 用数据分析解决商业问题 接地气的陈老师 电子工业出版社
41 利用Python进行数据分析(原书第2版) 美] Wes McKinney / 徐敬一 机械工业出版社
42 深入浅出Pandas : 利用Python进行数据处理与分析 李庆辉 机械工业出版社
43 Python数据分析与挖掘实战(第2版) 张良均 机械工业出版社
44 Python金融大数据分析 第2版 [德]伊夫·希尔皮斯科(Yves Hilpisch) 人民邮电出版社
45 机器学习:软件工程方法与实现
某大型金融科技集团资深大数据与机器学习技术专家撰写,基于新近Python版本 将软件工程的思想、方法、工具和策略应用到机器学习实践中,提供高质量的代码设计、可直接复用的源码和工业应用框架 张春强 / 张和平 / 唐振 机械工业出版社
46 Python大数据分析与机器学习商业案例实战 王宇韬 / 钱妍竹 机械工业出版社
47 数据挖掘 概念与技术(原书第3版) (美)Jiawei Han / (加)Micheline Kamber / (加)Jian Pei 机械工业出版社
48 数据挖掘与分析 概念与算法 [美] Mohammed J. Zaki / [巴西] Wagner Meira Jr. 人民邮电出版社
49 数据挖掘与数据化运营实战 : 思路、方法、技巧与应用 卢辉 机械工业出版社
50 计算智能 : Computational Intelligence: Concepts to Implementations Russell C. Eberhart / Yuhui Shi 人民邮电出版社
51 计算广告:互联网商业变现的市场与技术(第3版) 刘鹏 / 王超 人民邮电出版社
52 程序化广告 个性化精准投放实用手册 梁丽丽 人民邮电出版社
53 程序化广告实战 : 私有化程序购买领域的布道者的一线实战笔记 吴俊 机械工业出版社
54 一本书读透Martech智慧营销 吴俊 / 李焱 / 党莎 机械工业出版社
55 数据赋能 : 数字化营销与运营新实战 宋星 电子工业出版社
56 华为数字化转型之道 华为公司企业架构与变革管理部 机械工业出版社
57 大数据技术及架构图解实战派 徐葳 电子工业出版社
58 精益数据方法论:数据驱动的数字化转型 史凯 机械工业出版社
59 财务数据治理实战 DAMA中国 郑保卫 清华大学出版社
60 一本书讲透数据治理:战略、方法、工具与实践 用友平台与数据智能团队 机械工业出版社
61 大数据实践之路:数据中台+数据分析+产品应用 林泽丰 / 许秋贵 / 陈斌 / 陈丽媛 电子工业出版社
62 大数据日知录 张俊林 电子工业出版社
63 数据驱动:从方法到实践 桑文锋 电子工业出版社
64 用数据讲故事(修订版) [美]科尔·努斯鲍默·纳福利克(Cole Nussbaumer Knaflic) / 陆昊 / 吴梦颖 人民邮电出版社
65 数据中台产品经理:从数据体系到数据平台实战 张小墨 电子工业出版社
66 DAMA数据管理知识体系指南(原书第2版) 数据管理协会(DAMA国际) 机械工业出版社
67 更好的数据可视化指南 Jonathan Schwabish / 易炜 电子工业出版社
68 对比Excel,轻松学习Python数据分析 张俊红 电子工业出版社
69 对比Excel,轻松学习SQL数据分析 张俊红 电子工业出版社
70 对比Excel,轻松学习Python报表自动化 张俊红 电子工业出版社
71 对比Excel,轻松学习Python统计分析 张俊红 电子工业出版社
72 数据治理:工业企业数字化转型之道 祝守宇 / 蔡春久 电子工业出版社
73 项目管理知识体系指南(PMBOK指南)(第6版) [美]项目管理协会 电子工业出版社
74 流程优化风暴:企业流程数字化转型从战略到落地 王磊 机械工业出版社
75 腾讯大数据构建之道 蒋杰 / 刘煜宏,陈鹏,郑礼雄 机械工业出版社
76 中台战略:中台建设与数字商业 陈新宇 罗家鹰 邓通 江威 机械工业出版社
77 SaaS商业实战 : 好模式如何变成好生意 代珂 机械工业出版社
78 穿越数据的迷宫:数据管理执行指南 [美]劳拉?塞巴斯蒂安-科尔曼(Laura Sebastian-Coleman) / 汪广盛 机械工业出版社
79 聚合架构:面向数字生态的构件化企业架构 付晓岩 机械工业出版社
80 ECharts数据可视化 : 入门、实战与进阶 王大伟 机械工业出版社
81 Android全埋点解决方案 王灼洲 机械工业出版社
82 iOS全埋点解决方案 王灼洲 机械工业出版社
83 Python网络爬虫技术与实战 赵国生 机械工业出版社
84 社交网站的数据挖掘与分析(原书第3版) Matthew,A.Russell,Mikhail,Klassen 苏统华 郭勇 潘巍 机械工业出版社
85 广告数据定量分析:如何成为一位厉害的广告优化师 齐云涧 机械工业出版社
86 电商数据分析与数据化运营 刘振华 机械工业出版社
87 数据科学工程实践 : 用户行为分析与建模、A/B实验、SQLFlow 谢梁 / 缪莹莹 / 高梓尧 / 王子玲 机械工业出版社
88 电商流量数据化运营 宋天龙 机械工业出版社
89 数据思维 : 人人必会的数据认知技能 [美] 乔丹·莫罗 / 耿修林 广东经济出版社
90 精益数据分析 [加] 阿利斯泰尔·克罗尔 / [加] 本杰明·尤科维奇 / 韩知白 / 王鹤达 人民邮电出版社
91 精益业务数据分析 CDA 数据科学研究院 电子工业出版社
92 大数据大创新:阿里巴巴云上数据中台之道 邓中华 电子工业出版社
93 企业IT架构转型之道:阿里巴巴中台战略思想与架构实战 钟华 机械工业出版社
94 华为数据之道 华为公司数据管理部 机械工业出版社
95 数据资产管理 : 盘活大数据时代的隐形财富 高伟 机械工业出版社
96 中台实践:数字化转型方法论与解决方案 陈新宇 / 罗家鹰 / 江 威 / 邓 通 机械工业出版社
97 主数据管理:企业数据化建设基础 张旭 / 陈吉平 / 杨海峰 电子工业出版社
98 大数据处理之道 何金池 电子工业出版社
99 金字塔原理 : 思考、表达和解决问题的逻辑 [美]芭芭拉•明托 / 汪洱 / 高愉 南海出版公司
100 金字塔原理 : 实战篇 [美] 芭芭拉·明托 / 罗若苹 南海出版公司
相关文章:
大数据书单(100本)
大数据书单(100本) 序号 书名 作者 出版社 1 Hadoop权威指南:大数据的存储与分析(第4版)(修订版)(升级版) Tom White 清华大学出版社 2 Hive编程指南 卡普廖洛 (Edward Capriolo) / 万普勒 (Dean Wampler) / 卢森格林 (Jason Rutherglen) / 曹坤 人民邮…...
python实战应用讲解-【语法基础篇】初识Python(附示例代码)
目录 前言 Python基础 基本概念: 为什么使用Python? Python2.x与3.x版本区别...
【2023保研夏令营】网安、CS(西交、华师、科、南等)
文章目录一、基本情况二、投递和入营情况三、考核情况1. 西交软院(面试)2. 川大网安(笔试面试)3. 华东师范数据学院(机试面试)4. 人大信息学院专硕(机试面试,保密)5. 南大…...
Qt COM组件导出源文件
文章目录摘要dumpcpp.exe注册COM组件COM 组件转CPP参考关键字: Qt、 COM、 组件、 源文件、 dumpcpp摘要 由于厂家提供的库不是纯净C库,是基于COM组件开的库,在和厂家友好交流无果下,只能研究下Qt 如何调用,好在Qt 的…...
各数据库数据类型的介绍和匹配
各数据库数据类型的介绍和匹配1. Oracle的数据类型2. Mysql的数据类型3. Sql server的数据类型4. 类型匹配5. Awakening1. Oracle的数据类型 数据类型介绍 VARCHAR2 :可变长度的字符串 最大长度4000 bytes 可做索引的最大长度749; NCHAR :根据字符集而定的固定长度字…...
Rancher 部署 MySQL
文章目录创建 pvc部署 MySQL前置条件:安装 rancher,可参考文章 docker 部署 rancher 创建 pvc MySQL 数据库是需要存储的,所以必须先准备 pvc 创建 pvc 自定义 pvc 名称选择已经新建好的 storageclass,storageclass 的创建可参考…...
Python语言零基础入门教程(二十五)
Python OS 文件/目录方法 Python语言零基础入门教程(二十四) 39、Python os.openpty() 方法 概述 os.openpty() 方法用于打开一个新的伪终端对。返回 pty 和 tty的文件描述符。 语法 openpty()方法语法格式如下: os.openpty()参数 无 返…...
蓝桥杯算法训练合集十五 1.打翻的闹钟2.智斗锅鸡3.文件列表
目录 1.打翻的闹钟 2.智斗锅鸡 3.文件列表 1.打翻的闹钟 问题描述 冯迭伊曼晚上刷吉米多维奇刷的太勤奋了,几乎天天迟到。崔神为了让VonDieEman改掉迟到的坏毛病,给他买了个闹钟。 一天早上,老冯被闹钟吵醒,他随手将闹钟按掉丢…...
CPU扫盲-CPU与指令集
指令集架构就像是特定的CPU的设计图纸,它规定了这个CPU需要支持那些指令、寄存器有那些状态以及输入输出模型。根据指令集结构的设计,在CPU上通过硬件电路进行实现,就得到了支持该指令集的CPU。指令集就像是我们编程语言中的接口,…...
VINS-Mono/Fusion与OpenCV去畸变对比
VINS中没有直接使用opencv的去畸变函数,而是自己编写了迭代函数完成去畸变操作,主要是为了加快去畸变计算速度 本文对二者的结果精度和耗时进行了对比 VINS-Mono/Fusion与OpenCV去畸变对比1 去畸变原理2 代码实现2.1 OpenCV去畸变2.2 VINS去畸变3 二者对…...
jmx prometheus引起的一次cpu飙高
用户接入了jmx agent进行prometheus监控后,在某个时间点出现cpu飙高 排查思路: 1、top,找到java进程ID 2、top -Hp 进程ID,找到java进程下占用高CPU的线程ID 3、jstack 进程ID,找到那个高CPU的线程ID的堆栈。 4、分析堆…...
Android 虚拟 A/B 详解(六) SnapshotManager 之状态数据
本文为洛奇看世界(guyongqiangx)原创,转载请注明出处。 原文链接:https://blog.csdn.net/guyongqiangx/article/details/129094203 Android 虚拟 A/B 分区《AAndroid 虚拟 A/B 分区》系列,更新中,文章列表: Android 虚拟分区详解(一) 参考资料推荐Android 虚拟分区详解(二…...
Python快速入门系列之一:Python对象
Python对象1. 列表(list)2. 元组(tuple)3. 字典(dict)4. 集合(set)5. 字符串(string)6. BIF (Built-in Function)7. 列表、集合以及字…...
【博客626】不同类型的ARP报文作用以及ARP老化机制
不同类型的ARP报文作用以及ARP老化机制 1、ARP协议及报文 2、不同类型的ARP报文作用 3、ARP工作原理 4、ARP老化机制 5、Linux ARP老化机制 ARP状态机: 在上图中,我们看到只有arp缓存项的reachable状态对于外发包是可用的,对于stale状态的…...
nacos discovery和config
微服务和nacos版本都在2.x及之后。1、discovery用于服务注册,将想要注册的服务注册到nacos中,被naocs发现。pom引入的依赖是:yml配置文件中:2、config用于获取nacos配置管理->配置列表下配置文件中的内容pom引入的依赖是&#…...
【算法数据结构体系篇class06】:堆、大根堆、小根堆、优先队列
一、堆结构1)堆结构就是用数组实现的完全二叉树结构2)完全二叉树中如果每棵子树的最大值都在顶部就是大根堆3)完全二叉树中如果每棵子树的最小值都在顶部就是小根堆4)堆结构的heapInsert与heapify操作5)堆结构的增大ad…...
试题 算法提高 最小字符串
资源限制内存限制:256.0MB C/C时间限制:2.0s Java时间限制:6.0s Python时间限制:10.0s问题描述给定一些字符串(只包含小写字母),要求将他们串起来构成一个字典序最小的字符串。输入格式第一行T,表示有T组数据。接下来T…...
已解决ImportError: cannot import name ‘featureextractor‘ from ‘radiomics‘
已解决from radiomics import featureextractor导包,抛出ImportError: cannot import name ‘featureextractor‘ from ‘radiomics‘异常的正确解决方法,亲测有效!!! 文章目录报错问题报错翻译报错原因解决方法联系博…...
乡村振兴研究:全网最全指标农村经济面板数据(2000-2021年)
数据来源:国家统计局 时间跨度:2000-2021年 区域范围:全国31省 指标说明: 部分样例数据: 行政区划代码地区年份经度纬度乡镇数(个)乡数(个)镇数(个)村民委员会数(个)乡村户数(万户)乡村人口(万人)乡村从业人员(万人…...
C语言中用rand()函数产生一随机数
在C语言中如何产生一个随机数呢?用rand()函数。 rand()函数在头文件:#include <stdio.h>中,函数原型:int rand(void);。rand()会返回一个范围在0到RAND_MAX(32767)之间的随机数(整数&…...
关于系统架构
1.系统架构分类: C/S架构 B/S架构 2.C/S架构 Client / Server(客户端 / 服务器) 特点:需要安装特定的客户端软件。 C/S架构的系统优点和缺点: 优点: 1)速度快(软件中数据大部分都是集成到客户端当中,很少量的数据从服…...
LeetCode 1237. 找出给定方程的正整数解
原题链接 难度:middle\color{orange}{middle}middle 2023/2/18 每日一题 题目描述 给你一个函数 f(x,y)f(x, y)f(x,y) 和一个目标结果 zzz,函数公式未知,请你计算方程 f(x,y)zf(x,y) zf(x,y)z 所有可能的正整数 数对 xxx 和 yyy。满足条件…...
【ArcGIS Pro二次开发】(5):UI管理_自定义控件的位置
新增的自定义控件一般放在默认的【加载项】选项卡下,但是根据需求,我们可能需要将控件放在新的自定义选项卡下,在自定义选项卡添加系统自带的控件,将自定义的按钮等控件放在右键菜单栏里以方便使用,等等。 下面就以一…...
学习OpenGL图形2D/3D编程
环境:WindowsVisual Studio 2019最流行的几个库:GLUT,SDL,SFML和GLFWGLFWGLAD库查看显卡OPENGL支持情况VS2019glfwgladopenGL3.3顶点着色器片段着色器VAO-VBO-(EBO)->渲染VAO-VBO-EBO->texture纹理矩阵matrix对图形transfor…...
2023美赛思路 | A题时间序列预测任务的模型选择总结
2023美赛思路 | A题时间序列预测任务的模型选择总结 目录 2023美赛思路 | A题时间序列预测任务的模型选择总结基本介绍数据描述任务介绍时序模型基本介绍 这道题分析植被就行,主要涉及不同植被间的相互作用,有竞争有相互促进,我查了下“植物科学数据中心”和“中国迁地保护植…...
PHP教材管理系统设计(源代码+毕业论文)
【P003】PHP教材管理系统设计(源代码论文) 设计方案 本系统采用B/S结构,所有的程序及数据都放在服务器上,终端在取得相应的权限后使用Web页面浏览,录入,修改等功能。在语言方面使用PHP语言,在…...
nps内网穿透工具
一、准备一台有公网ip的服务器 https://github.com/ehang-io/nps/releases 在这个地址下载服务端的安装包,centos的下载这个 上传到服务器上。 二、然后解压,安装,启动 [rootadministrator ~]# tar xzvf linux_amd64_server.tar.gz [roo…...
webpack打包时的热模块替代配置以及source-map
1.HMR 在devServer当中添加hot:true 热模块化功能 含义:当其中有一个文件发生变化的时候,那么就会被重新打包一次,极大的提高了构建速度 A.样式文件:可以使用HMR功能,因为在style-loader当中实现了 B.js文件:默认不能使用HMR功能…...
Seata架构篇 - TCC模式
TCC 模式 概述 TCC 是分布式事务中的两阶段提交协议,它的全称为 Try-Confirm-Cancel,即资源预留(Try)、确认操作(Confirm)、取消操作(Cancel)。Try:对业务资源的检查并…...
前端最全面试题整理
前端基础 一、 HTTP/HTML/浏览器 1、说一下 http 和 https https 的 SSL 加密是在传输层实现的。 (1) http 和 https 的基本概念 http: 超文本传输协议,是互联网上应用最为广泛的一种网络协议,是一个客户端和服务器端请求和应答的标准(T…...
常州做网站公司有哪些/哪里能买精准客户电话
胎压监测 (15分) 小轿车中有一个系统随时监测四个车轮的胎压,如果四轮胎压不是很平衡,则可能对行车造成严重的影响。 taiya.JPG 让我们把四个车轮 —— 左前轮、右前轮、右后轮、左后轮 —— 顺次编号为 1、2、3、4。本题就请你编写一个监测程序&#x…...
刘涛做的婴儿玩具网站/线下推广怎么做
为什么80%的码农都做不了架构师?>>> MySQL安装文件分为两种,一种是msi格式的,一种是zip格式的。如果是msi格式的可以直接点击安装,按照它给出的安装提示进行安装(相信大家的英文可以看懂英文提示ÿ…...
网站建设开发原代码归属/怎么从网上找客户
TIOBE编程语言社区排行榜是编程语言流行趋势的一个指标,每月更新,这份排行榜排名基于互联网上有经验的程序员、课程和第三方厂商的数量。排名使用著名的搜索引擎(诸如Google、MSN、Yahoo!、Wikipedia、YouTube以及Baidu等)进行计算…...
商丘做网站多少钱/网站建设知名公司
网址1 网址2 网址3 随便点击以上任一链接,输入应用在google play上的网址就可以获取下载链接。...
哪家企业网站建设好/我的百度账号登录
以前一直没有仔细想过为什么如何设置随机数种子?设置随机数种子有什么用,今天有时间,拿出来分析一下: 直接通过rand() 函数获得随机数每次都会是一样,例如,第一次程序运行的时候是8,第二次运行还…...
制作网站怎么做导航栏/汕头seo网站建设
游标的属性返回值类型意 义%ROWCOUNT整型获得FETCH语句返回的数据行数%FOUND布尔型最近的FETCH语句返回一行数据则为真,否则为假%NOTFOUND布尔型与%FOUND属性返回值相反%ISOPEN布尔型游标已经打开时值为真,否则为假看的懂~~~~~~~~~~~~~~~~~࿰…...