当前位置: 首页 > news >正文

大数据 - 大数据入门第一篇 | 关于大数据你了解多少?

🐶1.1 概述

大数据(BigData):指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产

大数据主要解决、海量数据的采集、存储和分析计算问题。

按顺序给出数据存储单位:bit,Byte、KB、MB、GB、TB、PB、EB、ZB、YB、BB、NB、DB。

1Byte=8bit 1K=1024Byte 1MB=1024K

1G=1024M 1T=1024G 1P=1024T

🐶1.2 特点

1. Volumn(大量)

以社交媒体为例,全球每天产生的社交媒体内容,包括文字、图片和视频,都形成了巨大的数据量。例如,每天 Facebook、Instagram 和 Twitter 上共享的照片和消息,构成了庞大的数据集,远远超过传统数据库能够轻松处理的范围。

2. Velocity(高速)

在电子商务领域,实时交易数据的产生速度非常快。举例来说,亚马逊每秒处理数千笔交易,而这些交易数据需要即时分析以进行库存管理、个性化推荐等。这种高速的数据产生和处理要求系统能够实时响应,以满足业务需求。

3. Value(低价值密度)

在物联网(IoT)领域,传感器产生的大量数据可能包含很多噪音和冗余信息。

例如,一个智能城市中的传感器网络可能每秒收集大量关于交通、气象和环境的数据。然而,真正有价值的信息可能只占其中的一小部分。因此,从这些海量数据中提取出对城市规划或紧急情况响应有帮助的有用信息变得至关重要。

🐶1.3 大数据应用场景

  • 抖音:推荐的都是你喜欢的视频

  • 电商站内广告推荐:给用户推荐可能喜欢的商品

  • 零售:分析用户消费习惯,为用户购买商品提供方便,从而提升商品销量。经典案例:纸尿布+啤酒。

  • 物流仓储:京东物流,上午下单下午送达、下午下单次日上午送达。

  • 保险:海量数据挖掘及风险预测,助力保险行业精准营销,提升精细化定价能力。

  • 金融:多维度体现用户特征,帮助金融机构推荐优质客户,防范欺诈风险

  • 房产:大数据全面助力房地产行业,打造精准投策与营销,选出更合适的地,建造更合适的楼,卖给更合适的人。

  • 人工智能+5G+物联网+虚拟与现实+智能驾驶(汽车行业)+远程医疗

🐶1.4 大数据部门间业务流程分析

🐶1.5 大数据就业方向

大数据应用场景的广泛发展为大数据开发领域提供了丰富的工作机会。以下是一些与大数据开发相关的工作机会延伸:

1. 大数据工程师:

负责设计、构建和维护大规模的数据处理系统,确保高效地处理大量数据。这包括使用工具如Hadoop、Spark等进行数据处理和分析。

2. 数据架构师:

设计和管理整个数据架构,确保系统能够支持业务需求,并保持可扩展性和性能。

3. 数据科学家:

利用大数据进行深入分析,提取有价值的信息和洞察,为业务决策提供支持。需要掌握统计学、机器学习等相关领域知识。

4. 数据仓库工程师:

构建和维护数据仓库,使业务用户能够方便地访问和分析数据。使用工具如Amazon Redshift、Google BigQuery等。

5. ETL(Extract, Transform, Load)开发者:

负责将不同来源的数据抽取、转换和加载到目标系统中,确保数据的质量和一致性。

6. 实时数据处理工程师:

开发实时数据处理系统,确保系统能够在数据产生的同时进行实时分析和响应,适用于需要快速决策的场景。

7.云计算工程师:

在云平台上构建和管理大数据解决方案,例如使用AWS、Azure或Google Cloud等云服务提供商的大数据服务。

8. 数据安全工程师:

确保大数据系统的安全性,包括数据加密、访问控制、身份验证等方面的工作,以防止数据泄露和滥用。

9. 大数据产品经理:

负责制定大数据产品的战略方向,了解市场需求,并协调开发团队以实现产品目标。

10.机器学习工程师:

利用机器学习算法和模型,开发能够自动学习和适应的系统,用于处理大规模数据并提供智能化解决方案。

相关文章:

大数据 - 大数据入门第一篇 | 关于大数据你了解多少?

🐶1.1 概述 大数据(BigData):指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。 大数据主要解决、海量数据的采…...

C语言——扫雷

扫雷是一款经典的小游戏,那如何使用C语言实现一个扫雷游戏呢? 一、全部源码 直接把全部源码放在开头,如有需要,直接拿走。 源码分为三个文件: test.cpp/c 主函数的位置 #include "game.h"int main() {…...

计算机网络【DNS】

DNS 基本概述 与 HTTP、FTP 和 SMTP 一样,DNS 协议也是应用层的协议,DNS 使用客户-服务器模式运行在通信的端系统之间,在通信的端系统之间通过下面的端到端运输协议来传送 DNS 报文。但是 DNS 不是一个直接和用户打交道的应用。DNS 是为因特…...

Windows实现MySQL5.7主从复制(详细版)

使用免安装版本(官网下载地址) 在Windows上安装两种MySQL服务并同时开启服务 1.下载配置 打开解压文件所在位置,就新建一个配置文件my.ini。 2.主库安装 主库的my.ini配置文件如下: [mysqld] #设置主库端口,注意须是…...

AI 绘画 | Stable Diffusion 视频生成重绘

前言 本篇文章教会你如何使用Stable Diffusion WEB UI,实现视频的人物,或是动物重绘,可以更换人物或者动物,也可以有真实变为二次元。 视频展示 左边是原视频,右边是重绘视频原视频和Ai视频画面合并 教程 这里需要用到Stable Diffusion WEB UI的扩展插件ebsynth_utility…...

使用easyexcel对导出表格添加合计行

文章目录 一、背景二、实现1、写法一2、写法二 三、遇到的问题四、参考 一、背景 近期开发的一个新功能需要导出和前端展示样式一致的统计表格,而前端使用的elementui的table组件,show-summary属性选择后可以自动计算。后端导出时其他单元格与返回前端展…...

Springcloud Alibaba使用Canal将Mysql数据实时同步到Redis保证缓存的一致性

目录 1. 背景 2. Windows系统安装canal 3.Mysql准备工作 4. 公共依赖包 5. Redis缓存设计 6. mall-canal-service 1. 背景 canal [kənl] ,译意为水道/管道/沟渠,主要用途是基于 MySQL 数据库增量日志解析,提供增量数据订阅和消费。其诞…...

Python入门学习篇(十四)——模块文件操作

1 模块 1.1 理解 包: python中带有__init__.py文件的文件夹 模块: 文件名(不包含.py后缀),如python官方的time.py中time就是模块1.2 示例代码 import datetime# 调用datetime模块中的datetime类的now()方法 t datetime.datetime.now() # 格式化输出日期和时间 strftime(&qu…...

【数据结构】排序之交换排序(冒泡 | 快排)

交换目录 1. 前言2. 交换排序3. 冒泡排序3.1 分析3.2 代码实现 4. 快速排序4.1 hoare版本4.1.1 分析4.1.2 hoare版本代码 4.2 挖坑法4.2.1 分析4.2.2 挖坑法代码实现 4.3 前后指针版本4.3.1 分析4.3.2 前后指针版本代码实现 1. 前言 在之前的博客中介绍了插入排序,…...

AI电商时代开始:阿里能否反杀拼多多

“AI电商时代刚刚开始,对谁都是机会,也是挑战。” 针对阿里员工对于拼多多财报和电商等的讨论,马云在阿里内网罕见地参与了谈论并发言。 阿里巴巴一向雷厉风行,已打响了AI电商的“第一炮”。 根据《晚点LatePost》报道&#xff…...

STC8H系列单片机入门教程之NVC系列语音播报模块(九)

一、模块简述 ● 模组支持3.3V和5V单片机供电系统 ● 标准2.54MM间距排针与外部连接 ● 支持喇叭0.5W/8欧 ● 适合用于超声波距离、电子秤重量、时钟时间、温度、球赛比分等语音播报 二、引脚说明 序号 名称 说明 1 VCC 电源正(3.3V-5V&#…...

认识计算机网络——计算机网络的组成

计算机网络是由多个计算机和网络设备组成的系统,通过通信协议实现数据传输和信息交换。它是现代社会信息技术的重要支撑,广泛应用于各个领域。本文将介绍计算机网络的主要组成部分,包括硬件设备、软件协议和网络服务。 一、硬件设备 计算机网…...

数据的复制

基本概念 数据的复制指的是通过网络链接的多台机器保留相同的副本 为什么要进行数据的复制 使得用户和数据在地理上比较接近,因为大数据要求我们将计算安排在数据存放的位置和我们基本的内存模型不是很一样 ,比如磁盘调入内存之类的。即使系统的一部分…...

【辐射场】3D Gaussian Splatting

三维高斯…喷喷 \, 3D Gaussian Splatting,下文简称3DGS,是好一段时间以来在三维内容创作和三维重建领域比较有热度的一项技术。 它属于基于图像的三维重建方法,意思就是你对现实物体或者场景拍照片,就能给你训练成一个场景模型&a…...

冒泡排序--------(C每日一题)

冒泡排序&#xff1a; 每次将相邻的两个数比较,将小的调到前头--升序 冒泡排序一个结论&#xff1a; n个数要进行n-1轮比较&#xff0c;第j轮要进行n-j次两两比较 循环体代码&#xff1a; int main() {int i, j,n,a[10],t;//n是几个数比较for(j1;j<n-1;j)//控制轮次for…...

每日一练:LeeCode-347. 前 K 个高频元素(中) - 【优先级队列】

本文是力扣LeeCode-347. 前 K 个高频元素 学习与理解过程&#xff0c;本文仅做学习之用&#xff0c;对本题感兴趣的小伙伴可以出门左拐LeeCode。 给你一个整数数组 nums 和一个整数 k &#xff0c;请你返回其中出现频率前 k 高的元素。你可以按 任意顺序 返回答案。 示例 1: 输…...

<蓝桥杯软件赛>零基础备赛20周--第11周--贪心

报名明年4月蓝桥杯软件赛的同学们&#xff0c;如果你是大一零基础&#xff0c;目前懵懂中&#xff0c;不知该怎么办&#xff0c;可以看看本博客系列&#xff1a;备赛20周合集 20周的完整安排请点击&#xff1a;20周计划 每周发1个博客&#xff0c;共20周。 在QQ群上答疑&#x…...

PowerShell Instal 一键部署TeamCity

前言 TeamCity 是一个通用的 CI/CD 软件平台,可实现灵活的工作流程、协作和开发实践。允许在您的 DevOps 流程中成功实现持续集成、持续交付和持续部署。 系统支持 Centos7,8,9/Redhat7,8,9及复刻系列系统支持 Windows 10,11,2012,2016,2019,2022高版本建议使用9系列系统…...

将“渴望“乐谱写入AT24C02并读出播放

#include <reg51.h> // 包含51单片机寄存器定义的头文件 #include <intrins.h> //包含_nop_()函数定义的头文件 #define OP_READ 0xa1 // 器件地址以及读取操作,0xa1即为1010 0001B #define OP_WRITE 0xa0 // 器件地址以及写…...

Vue独立组件开发-动态组件

文章目录 一、前言二、实现三、优化四、总结五、最后 一、前言 在开发中&#xff0c;你经常会遇到这么一种情况&#xff1a;根据条件动态地切换某个组件&#xff0c;或动态地选择渲染某个组件。 Vue 提供了另外一个内置的组件 <component> 和 is 特性&#xff0c;可以更…...

前端八股文(HTML篇)

目录 1.什么是DOCTYPE,有何用呢&#xff1f; 2.说说对html语义化的理解 3.src和href的区别&#xff1f; 4.title与h1的区别&#xff0c;b与strong的区别&#xff0c;i与em的区别&#xff1f; 5.什么是严格模式与混杂模式&#xff1f; 6.前端页面有哪三层构成&#xff0c;分…...

RivaGAN 水印项目

git地址 https://github.com/DAI-Lab/RivaGAN Dockerfile (/tools下文件为git下的文件) ############################################### # 使用 NVIDIA CUDA 10.0 开发环境作为基础镜像 FROM kaldiasr/kaldi:gpu-ubuntu18.04-cuda10.0 # 设置非交互式安装模式以避免某些命…...

Games101作业5

1.实现Renderer.cpp 中的 Render()&#xff1a;为每个像素生成光线 这里你需要为每个像素生成一条对应的光 线&#xff0c;然后调用函数 castRay() 来得到颜色&#xff0c;最后将颜色存储在帧缓冲区的相 应像素中。 我们要做的就是将屏幕空间下的坐标最后转换到世界空间的坐标…...

Golang解决跨域问题【OPTIONS预处理请求】

Golang解决跨域问题 前置知识&#xff1a;跨域问题产生条件及原因 跨域是是因为浏览器的同源策略限制&#xff0c;是浏览器的一种安全机制&#xff0c;服务端之间是不存在跨域的。 所谓同源指的是两个页面具有相同的协议、主机和端口&#xff0c;三者有任一不相同即会产生跨域…...

复试 || 就业day05(2023.12.31)算法篇

文章目录 前言找不同最长回文串找到所有数组中消失的数字下一个更大元素 I键盘行 前言 &#x1f4ab;你好&#xff0c;我是辰chen&#xff0c;本文旨在准备考研复试或就业 &#x1f4ab;文章题目大多来自于 leetcode&#xff0c;当然也可能来自洛谷或其他刷题平台 &#x1f4ab…...

Spring-4-代理

前面提到过&#xff0c;在Spring中有两种类型的代理&#xff1a;使用JDK Proxy类创建的JDK代理以及使用CGLIB Enhancer类创建的基于CGLIB的代理。 你可能想知道这两种代理之间有什么区别&#xff0c;以及为什么 Spring需要两种代理类型。 在本节中&#xff0c;将详细研究代理…...

设计模式:抽象工厂模式(讲故事易懂)

抽象工厂模式 定义&#xff1a;将有关联关系的系列产品放到一个工厂里&#xff0c;通过该工厂生产一系列产品。 设计模式有三大分类&#xff1a;创建型模式、结构型模式、行为型模式 抽象工厂模式属于创建型模式 上篇 工厂方法模式 提到工厂方法模式中每个工厂只生产一种特定…...

C语言中的Strict Aliasing Rule

文章目录 前言没有警告不代表没有问题目前的应对方法 前言 很久没写了&#xff0c;水一篇。 最近有个代码在gcc 4.8.5上编译失败。编译失败的提示是&#xff1a; error: dereferencing type-punned pointer will break strict-aliasing rules [-Werrorstrict-aliasing]查了下…...

单字符检测模型charnet使用方法,极简

Git链接 安装按照上面的说明&#xff0c;说下使用。 把tools下面的test做了一点修改&#xff0c;可以读取一张图片&#xff0c;把里面的单个字符都检测和识别出来。 然后绘制到屏幕上。 import torch from charnet.modeling.model import CharNet import cv2, os import num…...

Erlang、RabbitMQ下载与安装教程(windows超详细)

目录 安装Erlang 1.首先安装RabbitMQ需要安装Erlang环境 2.点击下载好的.exe文件进行傻瓜式安装,一直next即可 3.配置Erlang环境变量 安装RabbitMQ 1.给出RabbitMQ官网下载址&#xff1a;Installing on Windows — RabbitMQ&#xff0c;找到 2.配置RabbitMQ环境变量&#xff0…...

旅游网站系统建设方案/线上营销课程

其实很早就知道 Request.QueryString["参数"]来得到URL中传递的参数&#xff0c;或者说是得到Get请求方式得到的数据&#xff1b;而Request.Form得到Form表单的提交的数据(这种理解是错误的)&#xff0c;今天在使用Jquery的Ajax&#xff0c;当使用Post方式时候&#…...

做网站卖装备/网页设计页面

有需求请评论或私信 可远程调试 基于PHP的毕设双选管理系统一 介绍 此毕设双选管理系统基于原生PHP开发&#xff0c;数据库mysql&#xff0c;前端bootstrap。系统角色分为学生&#xff0c;教师&#xff0c;审核员和管理员。系统核心流程为&#xff1a;学生提交选题申请后由教师…...

行业网站开发管理软件/如何进行网站推广?网站推广的基本手段有哪些

100佳精美的个性名片设计些列第四篇。名片&#xff0c;中国古代称名刺&#xff0c;是标示姓名及其所属组织、公司单位和联系方法的纸片。名片是新朋友互相认识、自我介绍的最快有效的方法。交换名片是商业交往的第一个标准官式动作。一起欣赏这些精美的个性名片。 61. REACTOR …...

装修招标网站/宁波seo外包平台

2019独角兽企业重金招聘Python工程师标准>>> git clone gitubuntu-12.04-LTS:gitolite-admin.git 如果克隆失败&#xff0c;需要 git clone gitubuntu-12.04-LTS:repositories/gitolite-admin.git 即可&#xff0c; 如果还是失败, 需要 git clone gitubuntu-12.04-L…...

如何建设动漫网站/百度云官网入口

转&#xff1a;http://www.360sps.com/Item/UseTopLink.aspx 在SharePoint 2010环境的页面中&#xff0c;导航链接总体上可以分为两类&#xff0c;一类是显示在左侧的快速启动栏&#xff0c;另一类就是显示在顶部的全部导航链接栏。这两种导航只支持2级菜单项&#xff0c;如果…...

网站怎么做链接/seo优化工作内容

realpg2016-02-01 23:03:08 08:00如果纯在 mysql 的场景下操作&#xff0c;不用内存 key-value 系统&#xff0c;我更倾向于用另外一种模型处理这种竞争抢购的逻辑。“需要先 select &#xff0c;然后 insert &#xff0c;最后 update -1 。最后这个-1 操作是不能出现负数的”我…...