文章目录
一、数据介绍
二、数据分析师的工作步骤
2.1 数据采集
2.2 数据清洗(ETL)
2.3 数据处理和分析
2.4 数据可视化及辅助业务决策
三、数据透视表和透视图的简介
3.1 数据透视表(Pivot Table)
3.1.1 定义与特点
3.1.2 数据透视表的功能
3.1.3 应用场景
3.2 数据透视图(Pivot Chart)
3.2.1 定义与特点
3.2.2 数据透视图的功能
3.2.3 应用场景
3.3 数据透视表与数据透视图的区别
四、数据透视表基本操作
4.1 数据透视表的创建
4.2 数据透视表的结构
4.2.1 字段列表
4.2.2 显示区域
4.2.3 值的操作
4.3 案例展示
4.4 超级表
五、数据透视图基本操作
5.1 数据透视图的创建
5.2 其他操作
5.2.1 清除生成的透视图
5.2.2 隐藏图表按钮
5.2.3 图表元素 - 数据标签格式的设置
5.3 案例展示
一、数据介绍
数据的特性: - 数据的变异性:数据会跟随时间、地点、生产生活以及客观规律发生变化。 - 数据的规律性:数据达到足够数量后会存在一定的内在规律。 - 数据的客观性:能够记录或佐证客观事实,不随主观意愿变化。
数据分析的核心作用在于通过数据揭示洞察、指导决策并推动优化。它能: - 现状描述:展示过去发生了什么,评估当前业务状态和业务构成。 - 原因探究:分析现状背后的原因,为企业问题诊断提供依据。 - 未来预测:基于历史数据和趋势,预测未来业务和市场表现,支持战略规划。 - 决策支持:为市场策略、销售预测、供应链优化等关键领域提供数据驱动的决策依据。 - 提升效率:通过自动化和智能化的数据分析工具,提高数据处理的效率和准确性。 - 降低成本:通过优化业务流程和资源配置,减少不必要的浪费和成本。 - 增强竞争力:通过深入了解需求,制定更符合需求的产品和服务策略,提升企业市场竞争力。
优秀数据分析师的三个特点:
扎实的技术功底: 掌握并熟练应用基本的数据分析工具、分析模型和分析方法。 注意:技术水平決定了数据分折师的下限
深入的业务理解: 能跑数据,不叫数据分析,和业务结合并产生价值才是数据分析。 注意:业务理解決定了ー个数据分析师的职业上限
出色的沟通表达: 具备高效听说写的能力和用数据讲故事的能力 注意:数据分析师经常和不同部门(如市场、销售、产品等)沟通,理解他们的需求,并将这些需求转化为数据分析项目。最后通过可视化和报告的形式清晰地展示分析结果,使非数据专业人士也能轻松理解。
二、数据分析师的工作步骤
四大步骤:数据采集、数据清洗、数据处理和分析、数据可视化及辅助业务决策。
使用到的技术如下
数据抓取:Python,Web Scraper等
数据清洗:Excel,SQL,Python等
数据分析:Excel,SQL,Python,Hadoop,Hive,Spark,Flink等
数据展示:Excel,FineBI,FineReport,Tableau,Power BI,Python,Echarts等
2.1 数据采集
数据采集: 是整个数据分析工作的起点,所采集和加取的全不全、对不对,直接决定数据分析工作的质量,影响后续所有的环节。 1)埋点 是针对特定用户行为或事件进行捕获、处理和发送的相关技术及其实施过程。 2)爬虫 利用代码模拟人的行为去各个网站抓取数据 3)程序应用接口(API) 连接各种软件系统,为了能在各系统之间共享数据而开放的技术接口管道。
2.2 数据清洗(ETL)
数据清洗(ETL): 利用有关技术如数理计算、数据挖掘或定义的清理规则将脏数据转化为满足数据质量要求的数据。 1)保证数据的质量,就是保证数据分析的质量 高质量的数据应当符合以下标准: • 完整性 • 唯一性 • 准确性 • 一致性 2)整洁有序的数据,可以提高数据分析的工作效率 • 每个变量独占一列 • 每条数据独占一行
ETL = extract + transform + load
2.3 数据处理和分析
数据处理与分析:是指通过某种方法和技巧,对准备好的数据进行探索、分析,从中发现因果关系、内部联系和业务规律等分折结果,为特定的研究或商业目的提供参考。 1)描述性分析 描述某项事物的特性。需要准确、完善甚至是实时的数据。 2)诊断性分析 在对描述性数据进行评估时,诊断分析工具将使分析师能够深入到细分的数据, 从而隔离出问题的根本原因。 3)预测性分析