数据分析相关面试题-BI工具部分

本文总结了SQL语法基础、Python数据分析工具和统计学方法在高等教育数据分析中的应用。SQL部分重点解析了WHERE与HAVING的区别、JOIN操作、窗口函数等核心概念；Python部分涵盖了Pandas数据处理、NumPy数值计算、Matplotlib/Seaborn可视化以及Scikit-learn机器学习模型；统计学部分介绍了A/B测试原理和BI工具使用。文章通过实际案例展示了如何运用

Ujimatsu

501人浏览 · 2026-03-30 11:47:43

Ujimatsu · 2026-03-30 11:47:43 发布

数据分析相关面试题汇总

基础概念

什么是 BI（商业智能）？

是一套完整的技术与解决方案，通过对企业分散在各业务系统中的数据进行采集、清洗、整合、建模、分析与可视化，将原始数据转化为清晰、可用的信息与结论，最终支撑企业经营分析、业务监控与科学决策。

BI 能解决企业哪些痛点？

数据分散，找不到数：

企业数据散落在 ERP、CRM、Excel、业务系统中，BI 可统一接入，形成一站式数据平台。

数据打架，口径不统一：

各部门报表不一致，BI 通过统一指标口径、统一数据模型，保证 “一份数据、一个结果”。

出报表慢、效率低：

传统靠人工导数据、做 Excel，周期长易出错；BI 可自动定时刷新、一键出报表。

业务人员无法自主分析：

以往需求全靠技术开发，响应慢；BI 支持自助拖拽分析，业务自主查数。

看不到全局，决策靠经验：

经营状况不透明，BI 通过仪表盘、可视化大屏，实时呈现业务全貌。

问题定位难，无法追溯原因：

只知道指标涨跌，不知道为什么；BI 支持下钻、联动、多维分析，快速定位根因。

缺乏预警，被动应对问题：

BI 可设置指标异常预警，主动提醒风险，从 “事后复盘” 变 “事前监控”。

BI 工具用来干什么？

BI 工具主要用来把企业里杂乱、分散的数据，变成直观、好用的分析结果，辅助业务决策。

1. 连接与整合数据

对接数据库、Excel、业务系统等各种数据源，打通数据孤岛。

2. 数据清洗与建模

对数据做简单处理、关联表、构建维度和指标，形成可分析的数据模型。

3. 制作可视化报表与看板

用图表展示数据，比如销售额、用户量、转化率、地域分布等。

4. 自助式多维分析

支持筛选、钻取、联动、对比，业务人员不用写 SQL 也能自己查数、分析。

5. 业务监控与预警

实时或定时更新数据，监控关键指标，异常时及时提醒。

6. 分享与权限管控

发布报表给同事、领导，并控制不同人能看哪些数据，保证安全。

常用 BI 功能？

数据连接：对接数据库、Excel、业务系统等多数据源。
数据建模：建立表关系、维度度量、指标计算。
可视化制作：拖拽生成图表、报表、仪表盘。
筛选查询：按时间、地区、品类等条件过滤数据。
钻取分析：从汇总数据下钻到明细数据。
联动与交互：一个图表筛选，其他图表同步变化。
同比 / 环比 / 占比等计算：快速做对比分析。
数据定时刷新：自动更新报表，保证数据最新。
报表分享与权限控制：发布给他人并设置查看 / 编辑权限。
预警提醒：指标异常时自动通知。

BI 系统一般由哪些部分组成？

BI 系统通常由数据源、数据整合与处理层、数据模型层、分析展示层、平台管理层五大部分组成：

1. 数据源层

业务数据库、日志数据、Excel/CSV、ERP、CRM、第三方接口等原始数据。

2. 数据整合与处理层（ETL）

对数据进行抽取、清洗、转换、去重、关联，形成干净规范的数据。

3. 数据模型层

构建事实表、维度表，形成星型 / 雪花模型，统一指标口径。

4. 分析与可视化层

报表制作、多维分析、筛选钻取联动、仪表盘、自助查询、预警等。

5. 平台管理与权限层

用户权限、数据权限、目录管理、定时刷新、任务调度、安全审计等。

BI 和报表系统的区别？

传统报表是固定、静态、被动看数；BI 是灵活、自助、主动分析，更侧重数据驱动决策。

灵活性不同

报表：格式固定、SQL 固定，改需求要重新开发。
BI：拖拽即可筛选、下钻、切换维度，灵活做多维分析。

数据交互能力不同

报表：只能看结果，不能深入探索。
BI：支持钻取、联动、筛选、跳转，可层层拆解问题。

使用人群不同

报表：主要由技术人员开发，业务人员只看结果。
BI：业务人员可自助分析，不用依赖技术。

数据视角不同

报表：多是平面、单维度展示。
BI：多维立体分析，可从时间、地区、产品等多维度切片。

时效性与扩展性

报表：扩展难，新增指标成本高。
BI：建模后可快速产出新报表，支持实时 / 定时更新。

总结

传统报表：固定格式、静态展示、开发周期长、业务无法自主分析。
BI 系统：灵活自助、多维分析、交互性强、支持钻取联动，侧重决策分析。

什么是数据建模？

数据建模，是在 BI 工具中对源数据进行结构化梳理与关系定义，把零散的数据表组织成一套适合分析、可直接拖拽使用的逻辑模型。

它不改变原始数据，只在 BI 层面构建分析结构，核心工作包括：

建立多张数据表之间的关联关系（如一对多、多对一）
明确区分维度字段与度量指标
定义字段格式、数据类型、维度层级（如年 - 季 - 月 - 日）
封装公共计算指标，统一口径
形成稳定、易用的分析模型，供所有报表复用

目的是让数据结构更清晰、查询更高效、分析更便捷，同时保证全平台报表指标口径一致。

什么是数据集？

数据集是 BI 工具中用于数据分析、制作图表和仪表板的基础数据单元，可以理解为经过整理后、可供直接分析使用的数据集合。

它通常来自数据库、数据仓库或文件，BI 工具会将这些源数据封装成一个独立的数据集对象，包含结构化的字段、行列数据，并支持定义维度、度量、数据格式等。

特点

是报表和可视化的直接数据源
可以是单表、多表关联结果或查询后的数据
支持在数据集中做简单处理，如过滤、重命名、添加计算字段
一份数据集可被多个报表复用，统一数据口径

什么是计算字段？

计算字段是指在 BI 工具中，不修改源头原始数据，而是基于已有的字段通过公式、函数或逻辑运算新生成的字段，专门用于满足分析和展示需求。

它只在 BI 分析模型里生效，不会写入数据库，既保证了源数据安全，又能灵活扩展指标。

常见用途

计算业务指标：如通过销售额和成本计算利润、利润率
数据格式处理：如拼接字段、格式化日期、处理文本
逻辑判断：如根据金额划分客群等级、判断是否为新用户
统一口径：在模型层定义一次，全平台报表可复用，避免重复计算

什么是数据权限？

数据权限，是 BI 平台为保证数据安全与合规使用，对不同用户、角色设置的数据访问控制规则，用来控制谁能查看哪些数据、不能查看哪些数据。

它主要分为两类：

行权限（数据行级别）控制用户能看到哪些行数据。例如：区域经理只能查看自己负责区域的销售数据，看不到其他区域的数据，实现数据按业务范围隔离。
列权限（数据字段级别）控制用户能看到哪些字段，隐藏敏感列。例如：对普通运营隐藏成本、利润、手机号、身份证等敏感字段，只开放销量、销售额等非敏感数据。

简单理解：行权限决定 “能看哪些数据”，列权限决定 “能看哪些字段”，既保证数据安全，又满足不同岗位的分析需要。

什么是数据缓存？

数据缓存，是 BI 工具为了提升查询效率、减少对底层数据库（如数仓）的重复请求，而将已经查询过的数据结果临时存储在高速访问区域的机制。

简单来说，就是 **“算过一次的数据，先存起来，下次要用直接拿，不用再重新算”**。

核心作用

提升响应速度：报表打开更快，图表加载更流畅，消除大数据量下的等待感。
减轻数据库压力：减少对底层数据库（如 Hive、ClickHouse）的并发查询次数，避免性能瓶颈。
优化用户体验：支持快速切换维度、筛选条件进行交互式分析，而无需每次都等待后台计算。

工作逻辑

当用户第一次执行查询时，BI 工具会将计算结果存入缓存。
当用户再次发起相同或相似的查询时，工具直接从缓存中读取数据，而不是重新执行查询语句。

关键特点

时效性：缓存数据有生命周期，到期后会自动刷新，确保数据新鲜。
自动管理：通常由 BI 工具自动处理，无需用户手动干预。

什么是自助分析？

自助分析，是指业务人员在 BI 工具中，不需要编写代码、不需要等待技术人员帮忙取数，通过简单的拖拽字段、选择图表、设置筛选条件等可视化操作，就能自己完成数据查询、制作报表和开展多维度分析的一种方式。

它的核心是降低数据分析门槛，让非技术人员也能自主探索数据。

主要特点

操作方式以拖拽、点选为主，简单易用
不需要写 SQL，不需要懂数据库结构
可以自由切换维度、筛选条件，灵活查看不同角度的数据
快速生成图表和看板，及时满足业务分析需求
减少对数据工程师、BI 开发人员的依赖，提高整体效率

ETL 与 BI 的关系？

ETL 是 BI 的 “数据加工厂”，BI 是 ETL 的 “展示窗口”，二者缺一不可。

ETL 负责数据处理

从各业务库、日志、文件中 ** 抽取（Extract）** 数据
做清洗、转换、去重、关联（Transform）
加载（Load）到数仓、数据集市，形成干净、规范、可分析的数据→ 简单说：把杂乱数据变成能用的数据

BI 负责分析展示

基于 ETL 处理好的数据进行建模、可视化、多维分析
做报表、看板、自助查询→ 简单说：把干净数据变成决策依据

二者关系

没有 ETL，BI 就是无源之水：原始脏数据无法直接做分析，报表不准、跑不动。
没有 BI，ETL 价值无法体现：数据处理完没人看、用不上，无法支撑业务。
实际工作中：ETL 提供数据底座，BI 做上层应用。

总结

ETL 是数据的抽取、清洗、转换和加载，为 BI 提供干净、规范、统一的数据基础。
BI 基于 ETL 处理后的数据做建模、可视化、自助分析，实现数据价值落地。
二者是数据处理与数据应用的上下游关系，共同支撑数据驱动决策。

维度和度量的区别？

维度：是 “怎么看数据” 的角度
度量：是 “要计算什么” 的数值

维度（Dimension）

用来分组、筛选、分类、切片的字段。
一般是文本、日期、类别。
例子：时间、地区、城市、商品类别、渠道、用户性别、订单状态。

度量（Measure）

用来计算、聚合、统计的字段。
一般是可求和、可平均的数值。
例子：销售额、订单量、用户数、成本、利润、客单价。

总结

维度：分析的角度 / 条件，用于分组筛选，多为文本 / 日期。
度量：分析的指标 / 结果，用于聚合计算，多为数值。

维度和度量的常见类型有哪些？

维度的常见类型

时间维度：年、季度、月、周、日、小时、工作日 / 周末、节假日等。
地理维度：国家、省份、城市、区域、商圈、门店地址等。
用户维度：用户 ID、性别、年龄、会员等级、新老客、注册渠道、设备类型等。
商品 / 产品维度：品类、品牌、规格、价格区间、上下架状态等。
业务维度：订单渠道、支付方式、活动名称、广告来源、订单状态等。
组织维度：部门、业务员、区域经理、分公司等。

度量的常见类型

总量型度量：销售额、订单量、用户数、访问量、曝光量、成本总额。
比值 / 转化率型：转化率、点击率、渗透率、复购率、退款率、毛利率。
均值型度量：客单价、人均消费、平均访问时长、平均订单金额。
累计 / 排名型：累计销售额、环比增幅、同比增速、排名、TOP 值。
极值型度量：最大订单金额、最小库存、最高日活等。

维度和度量在数据分析中的作用和应用场景是什么？

维度的作用与应用场景

作用：维度决定从什么角度去分析数据，用于对数据进行分类、分组、筛选、切片，搭建分析的框架。

应用场景：

按时间、地区、产品、渠道、用户类型等分组统计业务数据；
在图表中作为横轴、图例、筛选条件，实现多维度对比；
进行下钻、上卷、多维分析，比如从年度→月度→日期查看明细；
用于筛选过滤，只看某一类业务、某一区域的数据。

度量的作用与应用场景

作用：度量是被分析的具体数值指标，用于量化业务结果、计算统计、衡量业务好坏。

应用场景：

计算销售额、订单量、用户数、利润等核心业务指标；
在图表中作为纵轴数值，展示大小、趋势、占比；
做同比、环比、占比、转化率、均值等衍生计算；
用于指标监控、异常预警、排名对比，支撑决策判断。

什么是多维分析（OLAP）？

是一种基于维度 + 度量的数据分析方式，把数据抽象成数据立方体（Cube），从多个维度对数据进行灵活查询、切片、汇总和下钻，快速得到业务分析结果。

简单理解：不只是看一张固定报表，而是从时间、地区、产品、渠道等多个角度自由切分数据，快速看汇总、看明细、看对比。

核心操作

切片 / 切块：按某个或某几个维度筛选数据，只看某一部分。例：只看 “2025 年 + 华东地区” 的销售额。
上卷（聚合）：从细粒度汇总到粗粒度。例：按 “日期”→“月份”→“季度”→“年份” 汇总。
下钻（拆解）：从粗粒度拆到细粒度。例：大区→省份→城市→门店。
旋转（维度切换）：调换维度观察角度，比如把行和列互换，换视角分析。

什么是星型模型、雪花模型？

1. 星型模型（Star Schema）

结构：一张事实表在中间，周围直接关联多张维度表，维度表之间没有关联。
特点：结构简单、查询效率高、易于理解和维护。
适用：BI 建模最常用，大部分数仓、BI 工具都优先用星型。

2. 雪花模型（Snowflake Schema）

结构：在星型基础上，维度表还可以继续关联子维度表，像雪花一样层层展开。
特点：结构规范化、减少冗余数据，但关联更多、查询更复杂、性能稍差。
适用：数据规范化要求高、维度层级特别多的场景。

总结

星型模型：1 张事实表 + 多层维度表直接相连，结构简单、查询快，BI 最常用。
雪花模型：维度表还能再关联子维度，更规范但关联复杂、性能略低。

什么是事实表、维度表？

1. 事实表（Fact Table）

定义：记录业务具体发生的事件、行为、流水数据的表。
特点：
- 数据量非常大，行数多
- 主要存放可计算的数值字段（度量）
- 包含维度外键，用来关联维度表
例子：订单表、支付流水表、用户行为日志表
常见字段：用户 ID、商品 ID、订单金额、购买数量、时间戳

2. 维度表（Dimension Table）

定义：用于描述、分类、筛选事实的 “信息表”，提供分析角度。
特点：
- 数据量小，字段多、行数少
- 存放文本、类别、属性信息
- 一般有主键，被事实表引用
例子：用户信息表、商品表、地区表、时间表
常见字段：商品名称、品类、品牌、用户性别、省份、城市、年月

总结

事实表：存业务流水和度量，数据量大，记录 “发生了什么”。
维度表：存描述信息和分类，数据量小，提供 “从什么角度看”。

什么是指标口径？为什么要统一？

1. 什么是指标口径

指标口径，就是一个指标的统一定义规则，主要包括：

统计范围（哪些数据算、哪些不算）
计算逻辑（分子分母、加减乘除）
时间周期（日 / 周 / 月、是否剔除节假日）
过滤条件（是否剔除退款、测试订单、异常值等）
统计粒度（按用户、按订单、按商品）

简单说：口径就是 “这个数到底怎么算出来的”。

举个例子：

GMV：是否包含退款？是否包含取消订单？
活跃用户：是打开 APP 就算，还是必须点击 / 下单才算？不同口径算出来的数字完全不一样。

2. 为什么要统一指标口径

避免数据打架：业务、财务、运营各算各的，数据对不上，无法信任数据。
保证决策依据一致：所有人基于同一套数字说话，才能正确判断业务好坏。
降低沟通成本：不用每次都解释 “我这个数是怎么算的”，提高协作效率。
便于横向、纵向对比：同比、环比、部门对比、地区对比，必须口径一致才有意义。
便于 BI 看板统一展示：报表、图表、大屏才能输出一致结论。

如何确保指标口径的一致性？

1. 建立统一指标字典

把所有核心指标（GMV、UV、转化率、复购率等）统一录入指标字典，明确：

指标名称
计算公式
统计范围
过滤条件（是否剔除退款、测试单、异常值）
统计周期与粒度
口径负责人

让所有人查同一本 “数据字典”。

2. 统一数据源与 ETL 逻辑

指标统一从数仓 / 数据集市计算，不允许各部门直接从业务库取数。
ETL 过程统一清洗、过滤、去重，保证源头一致。

3. 统一数据模型

统一事实表、维度表定义。
统一时间、用户、商品、渠道等公共维度，避免口径混乱。

4. 统一 BI 计算逻辑

关键指标在 BI 中统一做成公共度量 / 指标，不允许每个人自己重新计算。
禁止在报表里随意加筛选、改公式。

5. 建立评审与变更机制

指标口径变更必须评审、通知相关方。
禁止私下改口径导致历史数据不可比。

6. 权限管控与规范使用

控制指标编辑权限，防止误改。
对业务人员做口径培训，明确指标含义。

7. 定期核对与校验

定期将 BI 指标与原始库、财务数据对账。
发现不一致立即排查口径或数据问题。

什么是钻取、联动、跳转、筛选？

1. 钻取（Drill）

从汇总数据 → 明细数据，或从粗粒度 → 细粒度层层查看。
常见两种：
- 下钻：大区 → 省份 → 城市 → 门店
- 上卷：日期 → 月份 → 季度 → 年份
作用：快速定位问题出在哪个细分维度。

2. 联动（Interaction/Linkage）

点击 / 筛选一个图表，其他所有图表同步更新。
例：点击 “华东地区”，销售额、订单量、用户数图表全部只显示华东数据。
作用：实现多组件联动分析，不用重复筛选。

3. 跳转（Drill-through / Jump）

从当前报表 → 另一张报表 / 页面，并自动携带参数。
例：从销售总览 → 跳转到某商品的详细销售明细报表。
作用：实现报表之间的串联，从概览深入到专题分析。

4. 筛选（Filter）

通过条件过滤出想要查看的数据范围。
常见筛选：时间、地区、渠道、商品类别、用户类型等。
作用：缩小分析范围，聚焦重点业务。

总结

钻取：汇总 ↔ 明细，层层深入看数据；
联动：一个组件变化，其他组件同步变化；
跳转：从一张报表跳到另一张报表并传参；
筛选：按条件过滤，只看想看的数据。

缓慢变化维 SCD 是什么？

1. 定义

SCD（Slowly Changing Dimension）缓慢变化维指维度表中的属性值会随时间缓慢变化，而不是频繁变动的一类维度。

比如：

用户原来的手机号、性别、会员等级发生变更
商品的分类、品牌调整
员工的部门、岗位变动
门店的所属区域、负责人变化

这些属性不是实时变，但过段时间会变，所以叫缓慢变化维。

2. 为什么要处理 SCD？

如果不处理，历史数据会被覆盖：

今天查去年的销售数据，用户所属城市已经变了
导致历史数据分析不准、无法追溯当时真实情况

所以需要用 SCD 策略保留历史状态。

3. 常见三种 SCD 类型（面试必背）

1. SCD Type 1 直接覆盖

新值直接覆盖旧值，不保留历史。
优点：简单；缺点：丢失历史。

2. SCD Type 2 新增行（最常用）

变化时新增一行，用生效时间、失效时间、是否生效标记。
优点：完整保留历史；缺点：数据量变大。

3. SCD Type 3 新增字段

加一列存旧值，如 原城市、现城市。
优点：简单保留上一版本；缺点：只能存有限历史。

总结

SCD 缓慢变化维，就是维度属性随时间缓慢变化，需要在数仓中处理以保留历史数据。常用三种方式：直接覆盖、新增行保留历史、新增字段存旧值，其中 Type 2 最常用。

数据不一致如何排查？

1. 先核对指标口径

两边统计范围、过滤条件是否一致（是否剔除退款 / 测试单 / 取消单）
时间周期、统计粒度是否相同（按天 / 按人 / 按订单）
计算公式是否一样（分子分母、去重方式）

2. 核对数据源是否相同

是否取自同一张表：业务库 / 数仓贴源层 / DWD / DWS
抽取时间、刷新频率是否一致（是否有一方未更新）

3. 检查 ETL 与数据加工环节

抽取是否完整：有无丢数据、过滤条件写错
清洗逻辑是否一致：去重规则、空值处理、异常值剔除
关联是否正确：多表关联是否出现重复或丢失（一对多导致膨胀）

4. 检查数据模型与关联逻辑

事实表与维度表关联键是否一致（类型、字段名）
是否存在一对多关联导致数据放大
缓慢变化维（SCD）处理是否正确，影响历史数据

5. 检查 BI 端计算逻辑

报表筛选条件、维度过滤是否一致
度量是否重复自定义，聚合方式不同（sum/count/distinct）
行权限、数据权限是否影响结果

6. 抽样对比定位具体差异

按天 / 按区域 / 按订单号抽样对比
找到具体哪一笔、哪一天对不上，快速定位问题点

BI 报表性能慢的常见原因？

数据量太大：明细数据过多、未做汇总，直接查询原始大表导致加载缓慢。
SQL / 查询逻辑复杂：多表关联过多、嵌套子查询、没有索引、存在全表扫描。
模型设计不合理：表关系混乱、维度冗余、未使用星型模型、关联字段类型不匹配。
未做数据预处理 / 聚合：每次查询都实时计算，没有提前生成汇总表、宽表。
数据库性能瓶颈：数据库配置低、连接数不足、磁盘 IO 慢、并发查询过多。
BI 工具端问题：图表过多、联动过多、计算字段复杂、缓存未开启。
网络与权限影响：网络延迟、行级权限 / 数据权限过滤逻辑太重。

如何优化 BI 报表性能？

一、数据层优化

减少数据量

按时间分区，只查必要周期数据
明细数据单独存放，报表用汇总表 / 聚合表

优化数据模型

使用星型模型，减少多表关联
构建宽表，提前合并多表数据
保证关联字段类型一致、建立索引

提前预计算

对复杂指标、同比环比提前 ETL 计算好
避免报表端实时大量计算

二、查询与数据库优化

优化 SQL / 查询

避免复杂子查询、不必要的关联
禁止全表扫描，加索引

提升数据库性能

升级配置、增加缓存
读写分离，使用数仓 / MPP 引擎

三、BI 端优化

简化报表

减少图表数量、关闭不必要联动
复杂计算改为公共指标

开启缓存

开启报表缓存、结果集缓存
设置合理刷新频率，不重复计算

分页与延迟加载

明细表格分页加载
大屏 / 复杂报表延迟渲染

四、权限与逻辑优化

简化行权限、数据权限逻辑
避免权限过滤带来大量计算

总结

减少数据量，使用分区、汇总表、宽表；
优化模型，采用星型模型，建立索引；
预计算复杂指标，避免实时计算；
简化报表，减少图表与联动；
开启缓存，合理设置刷新策略；
优化数据库与查询，提升底层性能。

常见可视化图表适用场景？

折线图场景：看趋势、变化、波动，如销售额月度走势、日活变化。
柱状图 / 条形图场景：分类对比、排名，如各地区销量、各品类销售额对比。
饼图 / 环形图场景：看占比、结构，如各渠道用户占比、成本结构。
漏斗图场景：流程转化分析，如浏览→加购→下单→支付的转化流失。
散点图场景：看两个指标之间的相关性，如广告花费与订单量关系。
地图场景：地理分布、区域对比，如全国各省销量、用户地域分布。
雷达图场景：多维度综合评估，如用户画像、产品多指标评分。
表格场景：需要精确数值、明细展示、核对数据。
指标卡 / 数字卡片场景：突出展示核心关键指标，如总 GMV、总订单数、今日销售额。

什么是数据看板？

数据看板，就是把企业的核心业务指标，通过图表、数字、卡片等可视化方式，集中展示在一个页面上，实现数据一站式查看、实时监控、快速决策。

主要特点

集中展示：把分散指标汇总在一个页面
可视化：用图表代替表格，直观易懂
实时 / 定时更新：数据自动刷新，不用手工做表
可交互：支持筛选、下钻、联动，深入分析
面向决策：突出关键指标，方便管理者快速判断

常见类型

业务总览看板（GMV、订单、用户）
销售看板、运营看板、财务看板
实时大屏、监控预警看板

典型仪表板有哪些？

1. 经营总览看板（老板 / 管理层驾驶舱）

核心指标：GMV、营收、利润、毛利率、费用率
内容：整体经营健康度、同比环比、关键指标预警
面向：高管、CEO、总经理

2. 销售看板

核心指标：销售额、订单量、客单价、回款、销售目标完成率
维度：区域、门店、业务员、产品、客户
面向：销售总监、区域经理

3. 电商 / 运营看板

核心指标：流量 UV、转化率、加购率、复购率、退款率
内容：渠道效果、活动效果、用户增长
面向：运营、电商负责人

4. 用户 / 增长看板

核心指标：新增用户、活跃用户、留存率、流失预警、用户画像
面向：用户增长、产品、运营

5. 财务看板

核心指标：收入、成本、费用、现金流、预算执行
面向：财务总监、财务分析

6. 供应链 / 库存看板

核心指标：库存周转、缺货率、发货时效、仓储利用率
面向：供应链、仓储、采购

7. 实时监控大屏

实时交易、实时流量、实时物流、实时预警
多用于指挥中心、展厅大屏

常用BI工具及其对比？

对比项	Tableau	Power BI	FineBI
厂商	Salesforce	微软	帆软
核心定位	可视化专家、专业探索	微软生态、低成本入门	国产企业级、中国式报表
可视化	极强（交互 / 地图 / 动效 / 像素级定制）	强（30 + 图表、Office 集成）	强（大屏 / 中国式复杂报表）
建模 / 计算	中 - 强（Tableau Calc、LOD）	极强（DAX+Power Query）	强（自助建模、计算字段、指标中心）
数据源	80+（国际生态强，国产适配弱）	微软系 + 通用（Excel/SharePoint 最优）	50+（国产数据库 / ERP / 云原生全兼容）
部署	SaaS / 本地（国内云体验一般）	桌面免费 / Pro/Premium（Azure 云）	公有 / 私有 / 混合 / 信创（全场景）
价格（2026）	高（Creator ≈75 美元 / 月 / 人）	低 - 中（Pro ≈108 元 / 月 / 人，桌面免费）	中 - 高（按用户 / 项目，企业授权）
本土化	弱（中文 / 国产系统适配差）	中（中文尚可，国内生态一般）	极强（中文、钉钉 / 企微、信创、合规）
学习曲线	陡（分析师友好，业务难上手）	中（业务可快速入门）	中 - 低（无代码自助，业务友好）
协作 / 权限	中（企业版强，授权贵）	强（Teams/SharePoint 深度集成）	极强（细粒度权限、多角色协作）
AI 能力	中（基础预测）	中 - 强（Copilot 自动分析）	强（NLP 问答、AI 图表、指标治理）

1. 可视化能力（最核心差异）

Tableau：可视化天花板，交互流畅、地图 / 动效 / 钻取最强，支持像素级定制，适合做专业报告、高管大屏、深度探索。
Power BI：图表丰富，与 Excel/PPT 无缝嵌入，适合日常汇报、部门级看板，定制性略逊于 Tableau。
FineBI：中国式报表最强（多表头、斜线、套打），大屏效果好，满足政企合规与复杂业务报表需求。

2. 数据建模与计算

Tableau：LOD 表达式强大，适合复杂分析，但建模偏界面化，ETL 能力一般。
Power BI：DAX+Power Query 组合最强，时间智能、多表建模、数据清洗能力接近数据库，适合复杂指标计算。
FineBI：自助建模（拖拽关联）+ 计算字段 + 指标中心，统一口径、业务人员可快速上手，ETL 能力强。

3. 生态与本土化

Tableau：国际生态成熟，国内服务、中文支持、国产数据库 / ERP 适配弱，合规与信创支持差。
Power BI：微软生态闭环（Office/Azure/Teams），国内网络与云体验一般，非微软生态适配一般。
FineBI：深度适配中国场景，支持国产数据库、钉钉 / 企微、信创、数据安全合规，服务响应快。

4. 成本与部署

Tableau：订阅制贵，适合预算充足、可视化优先的外企 / 专业团队。
Power BI：桌面版永久免费，Pro 版性价比高，适合微软生态、中小企业快速落地。
FineBI：项目 / 用户授权，适合中大型企业、政企，长期 TCO 更优。

选型建议

外企 / 可视化优先 / 专业探索 → Tableau
微软生态 / 低成本入门 / Excel 重度用户 → Power BI
中大型企业 / 政企 / 中国式报表 / 信创合规 → FineBI

典型场景匹配

场景	首选工具	理由
高管可视化大屏、专业分析报告	Tableau	交互与视觉效果最佳
财务 / 销售日常报表、Office 协同	Power BI	与 Excel/Teams 无缝集成
国企 / 金融 / 制造、复杂中式报表	FineBI	本土化、合规、权限强
业务人员自助分析、快速出数	FineBI/Power BI	无代码、上手快
大数据量、高并发、实时监控	FineBI/Tableau	大数据处理与性能强

Tableau

Tableau 是什么？

Tableau 是一款专注于数据可视化的商业智能（BI）工具，主打拖拽式操作、强大的交互分析和高质量可视化效果。

它可以连接多种数据源，快速制作图表、仪表板和报表，帮助业务人员和分析师直观探索数据、发现业务规律、支撑决策，无需编写大量代码即可完成自助式数据分析。

Tableau 的核心优势是什么？

1. 可视化能力极强

图表美观、交互流畅，支持丰富的图表类型与地图展示，可快速做出专业、直观的分析看板。

2. 拖拽式操作，简单易用

无需编写复杂代码，通过拖放字段即可完成分析，业务人员也能快速上手做自助分析。

3. 强大的多维交互分析

支持筛选、联动、钻取、高亮等交互，能灵活从不同维度探索数据。

4. 多数据源支持与混合分析

可连接数据库、Excel、数据仓库等几乎所有常见数据源，并支持跨数据源混合分析。

5. 计算能力强大

提供计算字段、表计算、LOD 表达式等，能实现复杂业务指标与精细化统计。

6. 性能优秀

支持数据提取（Extract）内存计算，即使数据量较大也能保持较快响应速度。

Tableau 适合哪些场景？

适合需要快速可视化、自助分析、实时监控、多维度探索的业务场景，尤其擅长数据探索和交互式 BI 展示。

1. 业务自助式分析（最核心）

业务人员自己拖拖拽拽出图表，不用等技术写 SQL
快速探索数据、找规律、做对比
适合：运营、销售、市场、财务、产品

2. 实时 / 准实时数据监控

实时大屏、业务看板、运营日报
对接数据库、数仓、实时接口
适合：电商实时 GMV、门店客流、物流监控、生产监控

3. 多维度钻取分析

地区→城市→门店、年份→季度→月份、品类→子类→商品
下钻、上卷、筛选、联动
适合：销售分析、用户行为分析、财务分析

4. 企业级 BI 报表与仪表板

统一数据出口，领导驾驶舱、部门报表
权限管控、定时订阅、自动刷新
适合：管理层看板、部门日报周报月报

5. 数据可视化展示与汇报

美观交互强，适合 PPT、汇报、对外演示
地图、漏斗、帕累托、趋势图等一键生成
适合：经营分析、业务汇报、数据大屏

6. 复杂指标与统计分析

同期环比、占比、排名、移动平均、LOD 复杂计算
适合：精细化运营分析、用户留存、转化漏斗

7. 跨多数据源整合分析

同时对接 MySQL、Oracle、Excel、CSV、数仓等
无需复杂 ETL，即可混合分析
适合：数据分散、多系统汇总分析

不适合的场景

超复杂固定格式中国式报表（复杂斜线、合并单元格）
超大数据量离线批量计算（更适合数仓 / Spark）
重度数据清洗、ETL 流程

Tableau 适合：自助分析、实时监控、多维度钻取、仪表板大屏、可视化汇报、跨源整合分析，不适合复杂固定报表和重度 ETL。

Tableau 工作流程是什么？

连接数据 → 整理数据 → 制作工作表 → 设计仪表板 → 分享与发布

1. 连接数据源：连接数据库、Excel、CSV、云数据等，选择实时连接或数据提取。

2. 数据预处理：在数据画布处理字段：重命名、拆分、分组、创建计算字段、处理关联关系（Join/Blending）。

3. 创建工作表（可视化）：拖拽维度、度量生成图表，设置颜色、大小、标签、提示，添加计算、筛选、排序、参考线。

4. 制作仪表板：将多个工作表组合成仪表板，设置布局、添加筛选器、文本、图片，配置交互联动。

5. 分享与发布：发布到 Tableau Server/Cloud，设置权限、定时刷新、订阅，供他人查看与交互。

Tableau 有哪些文件格式？

.twb —— Tableau 工作簿

只存图表结构、布局、计算
不包含原始数据
文件小，拷贝方便

.twbx —— 打包工作簿

把 twb + 数据源 + 图片 / 形状 全部打包在一起
发给别人直接打开就能用，最常用

.hyper —— 数据提取文件

Tableau 专用的高性能数据文件
用来加速查询、离线分析

.tds / .tdsx —— 数据源模板

保存连接信息、计算字段、别名
方便多个报表复用同一个数据源

Tableau 主要由哪些产品/模块组成？

1. Tableau Desktop

核心桌面端工具，用于连接数据源、制作工作表、仪表板、设计报表，是分析师最常用的开发环境。

2. Tableau Server

企业级服务器平台，用于发布、共享、协作报表，管理用户权限、调度刷新、实现企业级数据管控。

3. Tableau Online

云端版本的 Tableau Server，无需自建服务器，直接在云端使用。

4. Tableau Prep

专门用于数据清洗、数据预处理、数据整合的工具，负责把杂乱的原始数据处理成适合分析的干净数据。

5. Tableau Reader

免费的查看工具，只能打开查看 Tableau 报表，不能编辑和制作。

Desktop 做报表、Server/Online 发布共享、Prep 做清洗、Reader 只查看。

Tableau 如何连接数据？

Tableau 支持连接几乎所有常见数据源，包括各类数据库、Excel/CSV 文件、数据仓库、云数据平台等。连接方式主要分为两种：

实时连接（Live）直接与数据源建立实时查询连接，每次查看报表都会从源库查询数据，数据最新，但性能依赖数据库本身。
数据提取（Extract）将数据源中的数据抽取并保存为 Tableau 本地快照，加载到内存中计算，查询速度更快，适合大数据量和复杂分析，但数据不是实时的，需要定期刷新。

在操作上，通过 Tableau 左侧的数据源面板，选择对应数据源类型，输入连接信息后，即可将表拖入数据模型，并建立关联，供后续制作视图使用。

实时连接（Live）与提取（Extract）的区别？

1. 定义区别

Live（实时连接）直接连接原始数据源，每次打开或交互报表时，都实时向数据库发送查询，不把数据保存到 Tableau 本地。
Extract（数据提取）将数据源中的数据抽取出来，生成 Tableau 专属的 .hyper 本地文件，后续报表直接查询这个本地文件。

2. 数据实时性

Live：数据完全实时，数据库里变，报表立刻变。
Extract：数据是快照，只有刷新提取后才会更新。

3. 性能与速度

Live：速度依赖数据库性能，数据量大或复杂查询时会变慢。
Extract：经过压缩、索引优化，查询速度极快，适合大数据量、复杂仪表板。

4. 使用场景

Live 适合：
- 数据需要实时监控
- 数据频繁更新
- 数据量不大、数据库性能好
Extract 适合：
- 数据量大、查询慢
- 复杂仪表板、多图表联动
- 离线查看、弱网环境
- 需要提升交互流畅度

5. 优缺点总结

Live
- 优点：实时、不用管理刷新
- 缺点：依赖数据库、大数据量卡顿
Extract
- 优点：速度快、交互流畅、减轻数据库压力
- 缺点：数据不实时，需要定期刷新任务

什么是数据混合（Data Blending）？

数据混合是 Tableau 中用来关联多个不同数据源并进行联合分析的一种方式。

它并不是在数据源层面做 Join，而是在展示层面，将两个数据源按公共维度关联起来，分别查询各自数据后，在视图中合并展示。

特点

可以关联不同类型、不同服务器的数据源（如 MySQL + Excel）
以主数据源为基础，其他数据源作为辅助关联
不会生成新的物理表，只在视图层面聚合
通常是左关联逻辑，主表数据完整，从表匹配不到则显示为空

适用场景

跨库、跨平台数据需要联合展示
不方便直接在数据库里做 Join
轻度关联分析，不需要复杂多表联接

如何在Tableau中进行数据清洗和预处理？

Tableau 提供两种主要方式做数据清洗与预处理：

1. 使用 Tableau Prep（专业清洗工具）

Tableau Prep 是专门用于数据预处理的可视化工具，支持拖拽式数据流清洗，适合复杂、结构化的数据处理。常见操作包括：

数据接入：连接多种数据源，合并多张表
数据清洗：过滤无效行、处理空值、去重、拆分字段
字段处理：重命名、修改数据类型、创建计算字段
多表整合：Join、Union、聚合、透视（行列转换）
输出：生成 Hyper 提取数据或直接输出到数据库

流程可视化、可复用，适合企业级标准化数据处理。

2. 在 Tableau Desktop 中直接处理

适合简单、轻量的数据清洗：

数据类型修正：自动识别或手动修改日期、数字、字符串格式
处理空值：使用 ZN()、ISNULL() 等函数替换空值
字段拆分：对文本字段按分隔符拆分
数据过滤：在数据源层过滤不需要的行
创建计算字段：处理格式、修正逻辑、生成新指标
数据提取（Extract）：抽取数据时做聚合、过滤，减少数据量

总结

简单清洗在 Desktop 内直接处理；复杂、流程化、可复用的 ETL 用 Tableau Prep，实现数据接入、清洗、整合、输出的完整流程。

什么时候会出现“灰色度量”？

1. 字段被拖去当作维度使用，并且设成了离散

数值字段放到维度上、变成蓝色离散胶囊时，就会在度量区域变灰。

2. 多表关联 / 数据混合（Blending）时，字段找不到关联路径

Tableau 无法确定这个度量和当前视图维度的对应关系，就会灰掉不让用。

3. 多维数据源（Cube）中，度量和当前维度不兼容

某些维度和度量不能一起查询，字段直接变灰。

4. 字段被隐藏，或权限不足

被隐藏、受行级别安全限制、无查看权限时会显示灰色。

5. 数据类型不匹配或计算字段出错

公式错误、字段不存在、除以零等，会导致计算度量灰显。

如何解决“灰色度量”的问题？

字段被当成维度用了

右键灰色字段 → 转换为度量
或者从维度区拖回度量区

多表 / 数据混合（Blending）导致灰色

检查主数据源是否正确
建立关联字段（如订单 ID、客户 ID）
重新拖入视图，或更换主数据源

计算字段公式错误

编辑计算字段，修复公式
确保没有无效字段、除以零、语法错误

字段被隐藏

右键数据窗格 → 显示隐藏字段
找到后取消隐藏

多维数据源（Cube）不兼容

换一组可搭配的维度
或改用普通数据源连接

数据模型关联路径不明确

简化表关系，删除多余关联
使用 Join 代替 Blend

混合数据连接与数据 Blending 的区别？

核心区别

混合数据连接（Join / Relationship）是行级别物理合并，先合并数据再聚合计算。数据混合（Blending）是视图级别聚合后合并，先各自聚合再在视图里拼接。

详细区别

合并时机

Join / Relationship：先合并数据，后聚合计算。
Blending：先各自聚合，后合并展示。

数据源范围

Join / Relationship：同一个数据源内部的多张表。
Blending：多个完全独立的数据源，可以跨文件、跨数据库。

执行方式

Join / Relationship：数据库端一次查询完成合并。
Blending：分别查询每个数据源，在前端合并结果。

字段使用

Join / Relationship：所有字段可直接使用，无需特殊处理。
Blending：辅助数据源的字段必须聚合，维度常用 ATTR。

关联条件

Join / Relationship：支持等于、大于、小于等复杂条件。
Blending：仅支持等值关联。

数据粒度

Join / Relationship：适合粒度相同的数据。
Blending：支持主辅数据源粒度不同。

性能

Join / Relationship：性能更好。
Blending：相对较慢，适合轻量场景。

独立性

Join / Relationship：合并成一个整体结构。
Blending：数据源保持独立，可随时切换。

适用场景

使用 Join / Relationship：同库多表关联、需要明细数据、复杂分析。
使用 Blending：跨数据源快速对比、粒度不一致、临时补充指标。

总结

Join / Relationship：先拼表，再分析。
Blending：先算好，再拼图。

离散（Discrete）与连续（Continuous）的区别？

在 Tableau 中，离散和连续是字段的两种展示形式，用来控制字段在视图里的行为和外观，区别非常直观：

1. 外观颜色

离散：胶囊是蓝色
连续：胶囊是绿色

2. 含义与作用

离散（Discrete）表示分开、独立、可数的值，比如类别、地区、年份、性别。在视图中会生成标题、标签、分段的坐标轴，用来对数据进行分组。
连续（Continuous）表示不间断、范围型的值，比如销售额、温度、时间轴。在视图中会生成连续的坐标轴，用来展示数值范围和趋势。

3. 视图效果

离散字段放在行 / 列上 → 生成标题、分区、分段
连续字段放在行 / 列上 → 生成连续坐标轴（轴带刻度）

4. 典型例子

离散：省份、产品类别、星期、订单 ID
连续：销售额、利润、单价、完整时间轴

什么是计算字段（Calculated Field）？

计算字段是 Tableau 中根据已有的维度、度量，通过自定义公式、函数或逻辑表达式，新创建出来的一个字段。

它不会修改、写入原始数据源，只在当前工作簿内部生效，用于扩展分析指标、处理数据逻辑或统一计算口径。

主要特点

基于现有字段计算生成，不改动源数据
可以像普通字段一样拖入行、列、颜色、标签等
支持聚合函数、逻辑判断、字符串处理、日期计算等
一处定义，整个工作表、仪表板都可复用

常见用途

计算复合指标，如利润率、客单价、复购率
数据格式处理，如字段拼接、日期格式化
条件分组，如根据金额划分高 / 中 / 低客群
处理空值、异常值

Tableau 计算字段有哪些？

Tableau 的计算字段主要分为 3 大类，按实现方式和作用场景划分：

1. 基本计算字段（Basic Calculation）

直接在数据源粒度上进行计算，不依赖视图布局。

算术运算：销售额 = 单价 × 数量
字符串处理：拼接、截取、替换
日期计算：日期差、年份 / 月份提取
逻辑判断：IF、CASE 条件分组
空值处理：ISNULL、ZN

特点：行级别计算，结果是一条一条的，再参与聚合。

2. 表计算（Table Calculation）

基于视图已经展示出来的数据做二次计算，依赖视图结构。

同比、环比
累计求和、移动平均
排名 RANK
百分比、占比
差异计算

特点：只作用于视图结果，不影响底层数据。

3. LOD 表达式（Level of Detail）

用于精细化控制计算的维度级别，可以独立于视图粒度做聚合。

FIXED：固定按某些维度计算
INCLUDE：在视图维度基础上额外增加维度
EXCLUDE：在视图维度基础上排除某些维度

典型场景：

按客户 / 地区计算客单价、复购率
不依赖视图的独立聚合

总结

基本计算字段：行级别简单运算；
表计算：对视图结果做二次统计；
LOD 表达式：自定义计算粒度，实现复杂精细化分析。

Tableau 如何创建计算字段？

两种快速入口（任选其一）

数据窗格右键（最常用）左侧「数据」窗格空白处右键 → 选择创建 → 计算字段。
顶部菜单点击顶部菜单栏「分析」→ 选择创建计算字段Tableau。

4 步标准创建流程

1. 命名字段

在计算编辑器顶部输入清晰有意义的名称（如 “利润率”“折扣率”），方便后续复用。

2. 编写公式

核心规则：

用 ** 方括号 []** 包裹字段名（含空格必须加，如[销售金额]）Tableau；
支持聚合函数（SUM/AVG/COUNT）、逻辑判断（IF/CASE/IIF）、字符串 / 日期处理函数Tableau；
编辑器右侧可搜索函数，双击快速插入，带语法与示例。

3. 验证并保存

输入公式后，编辑器下方显示 **“计算有效”即通过；若报错会红色提示，修正后点击确定 **。

4. 查看与使用

新字段会添加到「数据」窗格，数据类型图标前带 = 标识，可像普通字段拖入行、列、标记卡、筛选器等位置使用Tableau。

高频面试示例

1. 基础算术计算（利润率）

利润率 = SUM([利润]) / SUM([销售金额])

说明：聚合后计算，避免行级别误差。

2. 条件逻辑分组（盈利标记）

盈利标记 = IIF(SUM([利润]) > 0, "盈利", "亏损")

说明：用IIF简化单条件判断，逻辑更清晰。

3. 日期差计算（订单天数）

订单距今天数 = DATEDIFF("day", [下单日期], TODAY())

说明：计算日期差值，支持天 / 月 / 年等单位。

四、关键面试要点

不修改源数据：仅在工作簿内生效，不影响底层数据库Tableau；
三处可修改：右键计算字段 → 选择编辑，或双击直接修改公式Tableau；
聚合规则：非聚合计算会自动按视图粒度聚合，需明确是否加聚合函数Tableau。

总结：右键数据窗格或点分析菜单，命名写公式，验证保存即用，不改动原始数据。

如何在Tableau中使用计算字段？

创建好计算字段后，使用方式和普通字段完全一致，可以直接在视图中拖拽使用，主要用在以下几个地方：

1. 拖到行、列区域

用来构建图表的坐标轴、分类，比如用计算出的 “利润率”“客单价” 作为指标展示。

2. 放到标记卡上

颜色：根据计算结果区分颜色（如盈利 / 亏损、高 / 中 / 低客群）
大小：用计算值控制图形大小
标签、提示：显示计算后的指标文本

3. 用作筛选器

把计算字段拖到筛选器，按计算结果过滤数据，例如只看 “利润率> 10%” 的数据。

4. 用于进一步计算

计算字段可以嵌套使用，作为其他计算、表计算、LOD 表达式的一部分。

5. 用于分组、排序

按计算结果对维度进行排序，或自定义分组逻辑。

总结

创建好的计算字段会出现在数据窗格里，直接像普通维度、度量一样拖拽到行、列、颜色、筛选器等处使用即可。

LOOKUP、PREVIOUS_VALUE、RUNNING_SUM 区别？

LOOKUP 取指定位置的值；PREVIOUS_VALUE 迭代上一次结果；RUNNING_SUM 累计求和。

1. LOOKUP

作用：根据偏移量，取当前行前面或后面某一行的值
语法：LOOKUP(表达式, 偏移量)
例子：
- LOOKUP(SUM(销售额), -1) → 取上一行的值
- LOOKUP(SUM(销售额), 1) → 取下一行的值
特点：只取某一行，不累积、不迭代

2. PREVIOUS_VALUE

作用：获取表计算上一次的计算结果，用于迭代计算
语法：PREVIOUS_VALUE(表达式)
典型场景：
- 环比、递归计算、自定义累计
- 第一行返回表达式本身，后面行返回上一步计算结果
特点：依赖计算顺序，是迭代函数，不是简单取历史行数据

3. RUNNING_SUM

作用：从第一行到当前行的累计求和
语法：RUNNING_SUM (表达式)
例子：10, 20, 30 → 结果 10, 30, 60
特点：标准累加，最常用的累计计算

总结

LOOKUP：取某一行的值（前后偏移）
PREVIOUS_VALUE：用上一次的计算结果（迭代）
RUNNING_SUM：从头到当前行累加

WINDOW_SUM 和 TOTAL 的区别？

计算范围不同

WINDOW_SUM (求和字段，起始行，结束行)

对当前窗口范围内的行求和，范围可以自己指定。

TOTAL (求和字段)

对当前分区内所有行直接求和，相当于固定范围的窗口求和。

范围写法对比

WINDOW_SUM(销售额, FIRST(), LAST())

等价于TOTAL(销售额)

但 WINDOW_SUM 可以灵活改范围：

WINDOW_SUM(销售额, 0, 0) → 只算当前行
WINDOW_SUM(销售额, -2, 0) → 当前行 + 前两行
WINDOW_SUM(销售额, FIRST(), 0) → 开头到当前行

使用场景区别

TOTAL：简单、快捷，只想算整个分区总和时用。

WINDOW_SUM：需要自定义窗口范围时用（前几行、后几行、中间一段等）。

什么是 LOD 表达式？作用是什么？

1. 什么是 LOD 表达式

LOD = Level of Detail，即详细级别表达式。它是 Tableau 中一种高级计算语法，允许你自定义数据聚合的维度级别，可以独立于当前视图的维度去执行聚合计算。

简单说：视图按什么维度分组，你可以不按它，自己指定按什么维度算。

2. 三种基本 LOD 语法

{FIXED [维度 1], [维度 2] : 聚合计算 }固定按指定维度进行聚合，完全不受视图影响。
{INCLUDE [维度] : 聚合计算 }在视图已有维度基础上，额外增加一个维度再计算。
{EXCLUDE [维度] : 聚合计算 }在视图已有维度基础上，排除某个维度再计算。

3. LOD 的核心作用

实现与视图粒度无关的聚合计算比如视图展示 “月份”，但你想同时显示 “每个客户的总消费”。
计算整体占比、组内排名、组内均值等复杂业务指标如：每个品类占总销售额的比例、每个地区的 TOP10 产品。
统一口径不管图表怎么切换维度，计算逻辑保持一致。
替代复杂表计算，更稳定、更直观

三种基本 LOD 语法用法与区别，举例说明？

三种 LOD：FIXED、INCLUDE、EXCLUDE

核心区别：计算时参考的「维度粒度」不同

1. FIXED LOD

语法

{FIXED [维度1], [维度2]: 聚合函数(字段)}

含义

固定按指定维度分组计算，忽略视图中其他维度

不受视图筛选、行列维度影响，只认 FIXED 里写的维度。

举例

按【地区】计算总销售额：

{FIXED [地区]: SUM([销售额])}

视图里再加【省份 / 城市】，这个值依然是整个地区的总额
常用于：排名、占比、同维度汇总

2. INCLUDE LOD

语法

{INCLUDE [维度1]: 聚合函数(字段)}

含义

在视图维度基础上，额外加入指定维度一起计算视图维度 + INCLUDE 维度 → 更小粒度计算，再返回视图展示。

举例

视图只有【地区】，想按【地区 + 省份】粒度算平均销售额：

{INCLUDE [维度1]: 聚合函数(字段)}

视图只显示地区，但计算时会先按「地区 + 省份」算平均
常用于：细粒度聚合后再粗粒度展示

3. EXCLUDE LOD

语法

{EXCLUDE [维度1]: 聚合函数(字段)}

含义

在视图维度基础上，排除指定维度，用更大粒度计算视图维度 - EXCLUDE 维度 → 更大粒度汇总。

举例

视图是【地区 + 省份】，想计算不含省份的地区总额：

{EXCLUDE [省份]: SUM([销售额])}

视图每行显示省份，但这个值是整个地区的总和
常用于：占比、同组汇总、百分比

核心区别

FIXED：自己指定维度，跟视图无关
INCLUDE：视图维度 + 额外维度（更细）
EXCLUDE：视图维度 − 指定维度（更粗）

LOD	粒度	作用	典型场景
FIXED	固定	无视视图，按指定维度算	地区总额、用户排名
INCLUDE	更细	视图 + 额外维度	细粒度均值 / 汇总
EXCLUDE	更粗	视图 - 指定维度	占比、组内总额

LOD 和表计算区别？

LOD：在数据聚合之前就计算，支持任意维度粒度，执行顺序靠前。
表计算：只对视图已聚合后的结果再计算，依赖视图结构，执行顺序最晚。

1. 执行时机不同

LOD：在维度 / 度量筛选之前执行，早于视图聚合。
表计算：在所有筛选、聚合之后执行，是最后一步计算。

2. 计算粒度不同

LOD：可以自己指定维度（FIXED/INCLUDE/EXCLUDE），不受视图维度限制。
表计算：只能在当前视图展示的维度范围内计算。

3. 依赖关系不同

LOD：不依赖视图布局，怎么拖图表结果都不变。
表计算：依赖视图结构、分区、寻址，换个布局结果可能变。

4. 嵌套支持

LOD：可以嵌套 LOD，不能嵌套表计算。
表计算：可以嵌套表计算，不能嵌套 LOD。

5. 典型用途

LOD：组内排名、用户首次时间、跨维度占比、独立粒度统计。
表计算：同比环比、累计求和、移动平均、排名、百分比。

高频手写SQL/计算字段

环比

SUM([销售额]) / LOOKUP(SUM([销售额]), -1) - 1

同比

SUM([销售额]) / LOOKUP(SUM([销售额]), -12) - 1

转化率

SUM([用户数]) / LOOKUP(SUM([用户数]), -1)

占比

SUM([销售额]) / TOTAL(SUM([销售额]))

LOD 的执行顺序是什么？

操作顺序决定了筛选器、LOD、聚合与表计算的执行先后，直接影响 LOD 结果与分析逻辑。以下为标准全流程，按阶段拆解，附三类 LOD 的精确执行位置与关键规则。

一、完整执行顺序（11 阶段）

按从上到下执行，前 6 阶段为数据源与筛选前置处理，后 5 阶段为计算与渲染，其中 LOD 分布在第 4、5、6 阶段。

阶段序号	操作类型	核心作用	LOD 关联与影响
1	提取筛选器（Extract Filters）	基于数据提取（.hyper）的筛选，提前过滤提取数据	所有 LOD 均受其影响，全局生效
2	数据源筛选器（Data Source Filters）	数据源层面的筛选（如数据连接参数、自定义 SQL）	所有 LOD 均受其影响，全局生效
3	上下文筛选器（Context Filters）	手动 “添加到上下文” 的筛选，固化为前置计算层	所有 LOD 均受其影响，优先级最高，可强制 FIXED 响应筛选
4	FIXED LOD 表达式计算	按指定维度聚合，忽略常规维度 / 度量筛选，仅受前 3 阶段筛选约束	最早执行，不随视图维度与常规筛选变化；典型场景：全局占比、固定基准值
5	维度筛选器（Dimension Filters）	常规维度筛选（如筛选器功能区维度、快速筛选）	不影响 FIXED；仅控制 INCLUDE/EXCLUDE LOD 与后续聚合
6	度量筛选器（Measure Filters）	度量值的筛选（如筛选器功能区度量、条件筛选）	位于 LOD 之后，仅过滤聚合结果；INCLUDE/EXCLUDE 受其约束
7	聚合计算（Aggregation）	按视图详细级别聚合数据（如 SUM、AVG）	处理 INCLUDE/EXCLUDE 与视图粒度的适配，自动聚合或重复值
8	表计算筛选器（Table Calculation Filters）	表计算的筛选（如同比、排名、移动平均的计算范围）	最后执行，仅隐藏标记，不影响底层计算
9	可视化渲染（Rendering）	生成图表、表格等视图	基于前 8 阶段结果渲染，不改变计算逻辑
10	交互筛选（Interactive Filters）	报表层面的交互筛选（如仪表板筛选器）	本质触发维度 / 度量筛选重算，不改变底层顺序
11	格式与布局（Formatting）	应用格式、布局设置	不影响数据计算，仅调整展示效果

二、三类 LOD 执行核心差异

LOD 类型	执行阶段	筛选器影响范围	典型场景	关键特性
FIXED	第 4 阶段（维度筛选前）	仅受提取 / 数据源 / 上下文筛选影响，完全忽略常规维度 / 度量筛选	全局销售额、各区域占比、不受视图筛选影响的基准值	不随视图维度变化，可作为维度使用
INCLUDE	第 7 阶段（维度 / 度量筛选后、聚合时）	受上下文 + 常规维度 / 度量筛选影响，自动纳入视图未显式维度	视图维度 + 补充维度聚合（如区域 + 产品类别汇总）	随视图维度与筛选变化，仅作为度量
EXCLUDE	第 7 阶段（维度 / 度量筛选后、聚合时）	受上下文 + 常规维度 / 度量筛选影响，显式剔除视图中指定维度	父级汇总（如按类别汇总，忽略子类别维度）	随视图维度与筛选变化，仅作为度量

三、关键规则与避坑指南

1. FIXED 不随视图筛选变化的解决方案

若需 FIXED 响应常规维度筛选，将该筛选器添加到上下文，强制其前置执行，使 FIXED 纳入筛选范围。例：{FIXED [Region] : SUM([Sales])}（筛选 [State] 时不变）→ 把 [State] 筛选器加入上下文，FIXED 会随 [State] 变化。

2. INCLUDE/EXCLUDE 与视图粒度的适配

INCLUDE：视图维度 + 指定维度共同决定粒度，结果不重复，需聚合。

EXCLUDE：视图维度剔除指定维度后的粒度，结果可能重复，默认 ATTR 聚合。

3. 常见场景选型（直接套用）

分析需求	推荐 LOD 类型	原因
计算全局占比（如全国销售额占比）	FIXED（无维度）	忽略常规筛选，保证分母为全局总销售额
按区域叠加产品类别汇总	INCLUDE [Product Category]	随视图区域维度变化，补充产品类别维度
按类别汇总，忽略子类别维度	EXCLUDE [Sub-Category]	剔除视图中子类别维度，还原类别粒度
同比 / 环比（随日期筛选变化）	INCLUDE/EXCLUDE 或 FIXED + 上下文	需随日期筛选变化，用 INCLUDE/EXCLUDE 更直接

总结

FIXED 先于维度筛选，不受常规维度过滤，仅受上下文约束。INCLUDE/EXCLUDE 后于维度筛选，随视图维度与筛选变化，仅作度量。上下文筛选优先级最高，可强制所有 LOD 响应筛选。

LOD 能不能嵌套？

可以嵌套，但有严格限制：

1. 可以怎么嵌套？

LOD 内部可以嵌套 LOD

{FIXED [地区]: MAX({FIXED [地区],[品类]: SUM([销售额])})}

LOD 内部可以嵌套普通聚合函数（SUM、MIN、MAX、AVG 等）

2. 不可以嵌套什么？

LOD 内部绝对不能嵌套表计算

例如：RUNNING_SUM、LOOKUP、WINDOW_SUM 等都不能放在 LOD 里面。

3. 为什么？

因为执行顺序不一样：

LOD 执行早

表计算执行最晚

LOD 计算时，表计算还没结果，所以不支持。

FIXED 会受上下文筛选影响吗？

默认情况下：FIXED LOD 不受上下文筛选影响。

为什么？

上下文筛选属于普通筛选级别
FIXED 执行顺序早于上下文筛选
所以上下文过滤后，FIXED 依然按全量数据计算

怎么让 FIXED 受上下文影响？（面试加分点）

1. 把上下文字段加入 FIXED 维度

{FIXED [地区], [年份]: SUM([销售额])}

2. 改用 INCLUDE 或 EXCLUDE LOD

3. 使用 表计算 替代 LOD

表计算筛选为什么不能过滤数据源？

因为表计算是在所有数据聚合、视图生成完成后才最后执行，它只对视图展示结果生效，不会去修改、过滤底层原始数据。

简单理解

数据先从数据源查询进来
做聚合、LOD、普通筛选
生成视图图表
最后才跑表计算

所以表计算筛选相当于：先把所有数据查出来，画完图，再把不想看的部分 “遮起来”，而不是从源头就不查这些数据。

为什么 TOP N 有时不准？怎么解决？

为什么不准？

因为 普通筛选是同时执行的，Tableau 会先算 TOP N，再应用其他筛选，而不是先过滤再算 TOP N，导致结果错乱。

怎么解决？

把用来限定范围的筛选器设置为【上下文筛选】。这样 Tableau 会：

先执行上下文筛选，生成小数据集
再在这个子集里计算 TOP N结果就准确了。

Tableau 常用聚合函数有哪些？

SUM：求和，用于计算总销售额、总数量等累计指标。

AVG：求平均值，如平均单价、平均订单金额。

COUNT / COUNTD：

COUNT：计数（包含重复值）
COUNTD：去重计数（distinct count），常用于统计客户数、订单数。

MAX / MIN：最大值、最小值，如最大订单金额、最小购买天数。

MEDIAN：中位数，用于稳健统计，避免极端值影响。

ZN：空值转 0，ZN([字段]) 空值显示为 0，常用于避免计算出错。

ATTR：属性函数，如果维度只有一个值就显示该值，否则显示 *，常用于视图固定维度。

为什么有的图表加了筛选结果不变？

1. 用了 LOD 计算（尤其是 FIXED）

FIXED LOD 执行早于普通筛选
筛选后视图变了，但 LOD 结果依然按全量数据算→ 所以图表看起来没变化

2. 用了表计算筛选

表计算筛选只 “遮住” 视图结果，不改变底层数据和计算
很多聚合、LOD 根本感知不到这个筛选→ 图表自然不变

3. 筛选字段和图表无关 / 维度不对应

筛选的字段根本没出现在视图里
或者数据没有关联（Blending 未匹配、Join 不对）→ 筛选相当于无效过滤

除了聚合函数，Tableau还有哪些常用函数？

1. 逻辑函数

IF / ELSEIF / ELSE / END：多条件判断，最常用。
IIF：简化版条件判断：IIF(条件, 满足值, 不满足值)
AND / OR / NOT：多条件组合
ISNULL / NOT ISNULL：判断是否为空值
IFNULL：为空则替换：IFNULL([字段], 0)

2. 字符串函数

LEFT / RIGHT / MID：截取字符串
LEN：字符串长度
UPPER / LOWER：大小写转换
CONCAT +：拼接字符串：[省份]+[城市]
TRIM：去除前后空格
REPLACE：替换字符
SPLIT：按分隔符拆分字段

3. 日期函数

TODAY()：获取当前日期
YEAR / MONTH / DAY：提取年、月、日
DATEDIFF：计算日期差：DATEDIFF('day', [开始日期], [结束日期])
DATEADD：日期偏移：加几天、几个月
DATETRUNC：日期截断，按年月对齐
NOW()：当前时间（含时分秒）

4. 数值函数

ROUND：四舍五入
ABS：绝对值
CEILING / FLOOR：向上 / 向下取整
LOG / EXP：对数、指数

5. 表计算函数（常用）

RANK / RANK_DENSE：排名
RUNNING_SUM：累计求和
WINDOW_SUM / WINDOW_AVG：窗口求和、平均
PREVIOUS_VALUE：上一行值
TOTAL：总计值，用于计算占比

6. 类型转换函数

STR：转字符串
INT / FLOAT：转整数、小数
DATE：转日期

Tableau 常用图表类型有哪些？

比较类

柱状图 / 条形图：最常用，用于对比各类别数值大小
直方图：展示数据分布

趋势类

折线图：展示时间趋势、变化情况
面积图：强调总量变化趋势

占比类

饼图：展示各部分占整体比例
环形图：美化版占比展示
堆积柱状 / 面积图：看部分与整体关系

关联关系类

散点图：看两个指标之间的相关性
气泡图：散点图 + 大小，展示三维信息

地理可视化

填充地图、点地图：展示地区分布数据

业务流程 / 转化类

漏斗图：用户转化、流失分析
帕累托图（二八分析）
甘特图：项目进度、时间周期

明细与什么是快速表计算？表格类

文本表（交叉表）
热力图：用颜色强弱展示数值大小

什么是快速表计算？

快速表计算是 Tableau 内置的、一键生成的常用表计算，不需要手动写复杂公式，直接通过右键菜单就能快速添加，用于对视图中的聚合结果做二次分析。

它本质上是基于视图已展示数据的计算，依赖视图的维度结构和分区方式。

常见的快速表计算类型

总计百分比（占比）
差异、百分比差异（环比、同比）
排序
累计求和
移动平均
排名
百分位

特点

无需写公式，右键 → 快速表计算 即可使用
基于视图展示结果计算，不影响底层数据
可通过计算依据调整计算方向（表横穿、表向下、区、单元格等）

总结

快速表计算是 Tableau 提供的一键式常用表计算，无需编写公式，可快速实现占比、环比、累计、排名等视图级二次计算。

Tableau 中有哪几种筛选器？

1. 数据源筛选器（Data Source Filter）

作用：在最源头过滤数据，只导入符合条件的数据
特点：效率最高，对整个数据源生效
场景：数据量极大，只需要部分数据时

2. 提取筛选器（Extract Filter）

作用：创建数据提取（.hyper）时过滤
特点：减少提取文件大小，提升性能
场景：数据抽取、离线分析

3. 上下文筛选器（Context Filter）

作用：设为优先执行的筛选，生成临时数据集
特点：会降低其他筛选器优先级，提高大数据量筛选速度
场景：TOP N、复杂条件、需要先圈定范围

4. 维度筛选器（Dimension Filter）

作用：按维度字段筛选（地区、类别、性别等）
特点：最常用，普通维度过滤
场景：选择特定省份、特定产品类别

5. 度量筛选器（Measure Filter）

作用：对聚合后的数值结果筛选（求和、平均后）
场景：只看销售额 > 10000 的记录

6. 表计算筛选器（Table Calculation Filter）

作用：对视图最终展示结果过滤，最后执行
场景：筛选排名前 10、增长率大于 0 的项

Tableau 上下文筛选是什么？

上下文筛选器是一种 “优先执行” 的筛选器，会先生成一个临时数据集，其他普通筛选器只在这个临时数据集里再过滤。

通俗理解

正常筛选：所有筛选器并列执行，可能互相影响、效率低
上下文筛选：
- 先把你设置为上下文的筛选条件执行一遍
- 生成一个缩小后的临时数据
- 其他筛选器只在这个小范围里筛选

就像：先圈定 “只看 2023 年数据”（上下文），再在 2023 年里筛选省份、产品，而不是全量数据里查。

核心特点

1. 优先级最高

早于维度、度量、普通筛选器执行

2. 生成临时数据集

数据量变小，后续筛选速度更快

3. 普通筛选变成 “依赖筛选”

只在上下文结果里生效，不会跨范围筛选

4. 可以多个上下文同时存在

它们会先合并计算，再生成临时数据

什么时候用？

数据量大，想提升筛选速度
做 TOP N 时，避免结果不准确
多个筛选器叠加，想明确先过滤谁
控制筛选范围，让后续筛选只在子集内执行

举例

视图：地区、销售额
筛选 1：年份 = 2023 → 设为上下文筛选
筛选 2：销售额 > 10000

结果：只会在 2023 年数据 里找销售额 > 10000 的，而不是在所有年份里先找销售额 > 10000 再筛年份。

总结

上下文筛选 = 优先执行的筛选器，先生成临时数据集，其他筛选只在这个子集里运行，更快、更准确。

Tableau 的交互能力有哪些？

Tableau 的交互主要分为视图内交互、筛选交互、钻取分析、联动交互、工具交互几大类，核心就是让图表 “可点、可查、可钻、可联动”。

1. 筛选交互（最常用）

快速筛选器、多值筛选、搜索筛选
通配符、日期范围、滑块筛选
上下文筛选、全局筛选

2. 钻取与层级交互

下钻（Drill Down）/ 上卷（Drill Up）例：年份 → 季度 → 月份 → 日期
自定义层级快速展开 / 折叠

3. 视图内直接交互

点击高亮：点图表某一部分，其他视图同步高亮
框选 / 圈选：框选一段数据查看细节
缩放：坐标轴缩放、区域放大
悬停提示：鼠标悬浮显示详情（Tooltip）

4. 仪表板联动（最核心交互）

筛选器联动：一个筛选控制多个图表
高亮联动：点一个图，其他图同步突出对应数据
页面跳转：点击跳转到其他仪表板 / 工作表

5. 表计算与动态交互

快速排序、TOP N 动态切换
百分比、累计、移动平均等实时计算
参数控制：用参数切换度量、维度、阈值

6. 地图交互

地图放大 / 缩小 / 平移
点选区域查看数据
地图与图表双向联动

7. 导出与分享交互

导出图片、数据、PDF
订阅、分享视图、评论协作

Tableau 怎么做漏斗？

Tableau 做漏斗图常用 3 种方法：简易条形漏斗（最快）、双轴对称漏斗（标准）、平滑漏斗（美观）。

一、准备数据

需要至少 2 个字段：

阶段维度：访问、加购、下单、支付、成交（必须按流程顺序）
数值度量：用户数 / 数量（SUM 聚合）

方法 1：简易条形漏斗（最快，面试首选）

适合快速出图、展示阶段数值与占比。

步骤

新建工作表，将阶段拖到行
将 用户数 拖到列（默认 SUM）
右键阶段 → 排序 → 按 用户数 降序（确保顶部最大）
标记类型改为条形
将阶段拖到颜色，区分各阶段
将 用户数 拖到标签，显示数值
右键 用户数 标签 → 添加表计算 → 总计百分比，显示转化率

效果

垂直条形，从上到下递减，形似漏斗。

方法 2：双轴对称漏斗（标准，最常用）

视觉更像漏斗，无空隙，支持交互。

步骤

阶段拖到行，按 用户数 降序排序
将 用户数 拖到列（轴 1）
按住 Ctrl 复制 用户数 到列（轴 2）
右键轴 2 → 双轴 → 右键轴 → 同步轴
双击左侧横轴 → 编辑轴 → 勾选倒序
标记类型：轴 1 设为条形，轴 2 设为条形（或隐藏轴 2）
阶段拖到颜色，用户数 拖到标签
隐藏两侧横轴标题，美化

原理

左右轴反向对称，中间无缝，形成标准漏斗轮廓。

方法 3：平滑漏斗（高级，美观）

用 面积图 + 表计算 实现平滑过渡。

步骤

阶段拖到列，按 用户数 降序
用户数 拖到行，标记改为面积
右键 用户数 → 添加表计算 → 计算类型：移动平均（窗口大小调大，如 2）
或用计算字段：RUNNING_SUM(SUM([用户数])) / TOTAL(SUM([用户数]))
调整颜色、标签，隐藏坐标轴

效果

无棱角、平滑渐变，适合汇报展示。

方法	优点	缺点	适用场景
简易条形	最快、易做、交互好	有间隙、不够像漏斗	快速分析、内部汇报
双轴对称	标准漏斗、无缝、交互强	步骤稍多	正式分析、Dashboard
平滑漏斗	美观、专业	需表计算、交互弱	对外展示、PPT

进阶：添加转化率标签

1. 创建计算字段 转化率：

SUM([用户数]) / LOOKUP(SUM([用户数]), -1)

（-1 表示上一阶段，首阶段为 100%）

2. 将 转化率 拖到标签，格式设为百分比

交互优化

筛选联动：添加 日期 / 地区 筛选，漏斗实时更新
高亮：点击阶段，其他图表同步高亮
参数切换：用参数切换 阶段维度（如渠道 / 产品）

如何制作帕累托图（80/20）？

帕累托图 = 降序条形图（数值）+ 累计占比折线（百分比）+ 双轴 + 80% 参考线，核心是累计占比计算与双轴组合。

一、准备工作（以示例超市数据源为例）

数据源：Tableau 自带「示例 - 超市」
分析维度：子类别（Sub-Category）
分析度量：销售额（Sales）
目标：找出贡献 80% 销售额的前 20% 子类别

二、详细操作步骤（按顺序执行）

1. 制作基础降序条形图

拖「子类别」到列，拖「销售额」到行（默认聚合为 SUM(销售额)）。
右键「子类别」→排序→选择「字段：销售额」→降序，让类别按销售额从高到低排列。
标记类型保持条形，完成基础视图。

2. 计算累计占比（核心步骤）

方法 A：用表计算（推荐，无需写公式）

1. 再拖一个「销售额」到行（出现两个 SUM(销售额)）。

2. 右键第二个「销售额」→快速表计算→汇总（Running Total）。

3. 再次右键→编辑表计算：

计算依据：特定维度→勾选「子类别」（寻址字段）。
勾选添加辅助计算→从属计算类型：合计百分比（Percent of Total）。
确定，此时第二个轴显示累计占比（0~100%）。

方法 B：自定义计算字段（灵活可控）

1. 右键数据面板→创建→计算字段，命名「累计占比」。

2. 输入公式：

RUNNING_SUM(SUM([销售额])) / TOTAL(SUM([销售额]))

含义：当前及之前所有类别的销售额总和 ÷ 总销售额。

3. 拖「累计占比」到行，替换第二个「销售额」。

3. 双轴组合（条形 + 折线）

右键第二个轴（累计占比）→双轴（Dual Axis），两个轴合并。
选中第一个标记卡（条形）→标记类型：条形；选中第二个标记卡（累计占比）→标记类型：线。
右键任意轴→同步轴，让两个轴刻度对齐（可选，更美观）。

4. 美化与 80/20 标记（面试加分）

（1）添加 80% 参考线

右键累计占比轴→添加参考线→类型：线→值：0.8→格式：虚线、橙色→确定。

（2）区分前 80% 类别（颜色标记）

1. 创建计算字段「是否前 80%」：

IF [累计占比] <= 0.8 THEN "前80%" ELSE "后20%" END

2. 拖「是否前 80%」到颜色标记卡，条形自动分色（前 80% 高亮）。

（3）添加标签与格式优化

勾选折线的标签，显示累计占比百分比。
隐藏网格线、调整字体、统一配色，完成最终视图。

三、极简背诵版（面试 30 秒答）

做降序条形图（维度 + 度量）。
复制度量，加汇总 + 合计百分比表计算，得累计占比。
双轴，条形 + 折线组合。
加80% 参考线，用颜色区分前 80% 类别。

四、常见问题与注意事项

排序必须是降序，否则累计占比逻辑错误。
表计算依据必须选特定维度（子类别），否则计算范围错误。
双轴后务必同步轴，避免视觉误导。
累计占比公式中，RUNNING_SUM 与 TOTAL 必须搭配使用。

如何制作地图？

1. 普通填充地图（省 / 市 / 国家区域图）

将地理字段（国家、省份、城市）拖到视图
Tableau 会自动生成经纬度并画出地图
把度量（销售额、人数）拖到颜色，实现深浅热力效果

2. 点地图（位置点分布）

直接拖地理字段到视图
度量拖到大小或颜色
标记改为圆形 / 形状，即可显示点位分布

3. 自定义经纬度地图

数据里有 经度、纬度 字段
分别拖到列、行
即可生成点位地图

4. 地理角色不对怎么办？

右键字段 → 地理角色 → 选择国家 / 省 / 市
或自定义地理编码

如何做甘特图？

Tableau 甘特图核心是时间轴 + 任务维度 + 持续时长，用水平条展示任务起止与周期，适合项目进度、订单周期、生产排期等场景。

一、必备数据结构（先准备好）

至少需要三类字段：

任务 / 主体维度：项目名、产品、客户、工序等（拖到「行」）
时间字段：开始日期（拖到「列」，设为连续精确日期）
持续时长：用 DATEDIFF 计算（拖到「大小」控制条长）

示例数据（项目管理）：

项目	任务	开始日期	结束日期	负责人
系统上线	需求调研	2026-04-01	2026-04-07	张三
系统上线	开发编码	2026-04-08	2026-04-25	李四

二、标准制作步骤（最快流程）

1. 计算持续时长（关键）

右键数据窗格 → 创建 → 计算字段
命名：持续天数
公式：DATEDIFF('day', [开始日期], [结束日期])
确定（左下角显示「计算有效」）

2. 搭建基础视图

把开始日期拖到「列」→ 右键 → 精确日期 → 连续（时间轴）
把任务 / 项目拖到「行」（左侧任务列表）
标记类型自动变为甘特条（若未变，手动选「甘特条」）
把持续天数拖到「大小」（条长 = 时长）

3. 美化与增强（可选）

颜色区分：把「负责人 / 状态」拖到「颜色」（不同人 / 状态用不同色）
标签显示：把「任务 / 持续天数」拖到「标签」（显示任务名 / 天数）
筛选时间：把「开始日期」拖到筛选器 → 选日期范围（聚焦近期）
调整条宽：右键「大小」→ 编辑大小 → 调最小 / 最大宽度

三、常见场景示例（直接套用）

场景 1：项目进度甘特图（最常用）

列：开始日期（连续精确）
行：项目 → 任务（嵌套层级）
大小：持续天数
颜色：负责人 / 进度状态
标签：任务名 + 持续天数

场景 2：订单履约周期（超市数据）

列：订单日期（连续精确）
行：产品子类 → 运输方式
大小：DATEDIFF('day', [订单日期], [发货日期])（发货时长）
颜色：区域 / 利润

场景 3：生产排期 / 设备占用

列：开工日期（连续）
行：设备编号 → 工序
大小：加工时长（小时 / 天）
颜色：工单状态

四、常见问题与解决

甘特条不显示 / 只有点

检查：开始日期是否设为「连续精确日期」（非离散 / 年 / 月）
检查：持续天数是否为正数（结束日期 > 开始日期）
标记类型必须是甘特条（非自动 / 条形）

时间轴太挤 / 看不清

筛选：只保留近期日期（如最近 30 天）
调整：视图 → 适合宽度，或缩小「大小」范围
聚合：日期改为「周 / 月」（适合宏观查看）

任务重叠 / 顺序乱

右键「行」的任务字段 → 排序 → 按开始日期升序
用「项目」分组，任务按时间顺序排列

显示实际 vs 计划对比

计算两个时长：计划天数、实际天数
把两个字段都拖到「大小」，用「颜色」区分计划 / 实际

总结

列放连续开始日期，行放任务维度，大小放 DATEDIFF 时长，颜色加维度，甘特图就成了。

Tableau 如何实现报表共享？

Tableau 报表共享核心是发布到 Server/Cloud（企业首选）、Public（公开）、打包文件（离线）、嵌入网页四大路径，下面按场景给出完整操作、权限与最佳实践。

企业级首选：发布到 Tableau Server / Cloud（最常用）

1. 核心优势

保留完整交互（筛选、钻取、联动、参数）
权限精细管控、数据实时刷新、支持协作
适合内部团队、客户、管理层使用

2. 操作步骤（Desktop → Server）

打开工作簿 → 顶部菜单 服务器 → 登录
- 输入 Server 地址（如 https://tableau.company.com）或选择 Tableau Cloud
- 用账号密码登录对应站点
服务器 → 发布工作簿
发布设置（关键）
- 项目：选择目标项目（无则联系管理员创建）
- 权限：默认继承项目权限；也可添加权限，给用户 / 组分配「查看 / 交互 / 编辑」
- 数据源：选择嵌入或发布为独立数据源（推荐后者便于复用）
- 刷新计划：设置自动刷新（如每日 / 每小时）
点击发布 → 成功后获取链接

3. 网页端共享（Server/Cloud）

打开报表 → 右上角 ⋯ → 共享
- 添加用户 / 组：输入邮箱 / 用户名，发送通知
- 复制链接：直接发链接给内部用户
- 嵌入代码：生成 iframe 嵌入内网门户
权限模板（常用）
- 查看者：仅看，无交互
- 交互式查看者：筛选、高亮、导出图片
- 编辑者：可修改、保存、发布副本

公开共享：Tableau Public（免费）

适用场景

对外展示、作品集、公开数据报告
⚠️ 注意：数据完全公开，不可用于敏感数据

操作步骤

注册 / 登录 Tableau Public 账号
Desktop → 服务器 → Tableau Public → 保存到 Tableau Public
填写标题、描述 → 发布
生成公开链接，可直接分享到社交媒体、网站

离线共享：打包文件 + Tableau Reader（无 Server）

适用场景

无 Server 环境、发给外部无 Tableau 账号的人
仅静态查看，无实时数据与交互

操作步骤

1. Desktop → 文件 → 另存为 → 打包工作簿（.twbx）

会把数据源、图片、自定义形状一起打包

2. 接收方安装 Tableau Reader（免费）

3. 用 Reader 打开 .twbx 即可查看

深度集成：嵌入网页 / 系统（内网门户、OA、APP）

适用场景

集成到公司 BI 门户、官网、内部系统
保留交互，用户无需登录 Tableau

操作步骤

1. Server/Cloud 打开报表 → ⋯ → 嵌入代码

2. 复制 iframe 代码，如：

<iframe src="https://tableau.company.com/views/Report/Dashboard" width="100%" height="800"></iframe>

3. 粘贴到网页 / 系统中

4. 管理员配置：站点设置 → 嵌入白名单，添加允许嵌入的域名

5. URL 参数（可选）：预设筛选，如

?Region=华东&Year=2026&Category=电子产品

静态导出（快照，无交互）

适合仅需截图 / 数据，不要求交互

导出图片：工作表 → 工作表 → 导出 → 图像
导出 PDF：文件 → 打印为 PDF
导出数据：右键视图 → 查看数据 → 导出所有数据

四种方式对比（快速选型）

方式	交互	权限	数据安全	适用场景
Server/Cloud	✅ 完整	✅ 精细	✅ 高（内网 / 私有云）	企业内部、客户、实时报表
Tableau Public	✅ 完整	❌ 公开	❌ 极低	作品集、公开报告
.twbx + Reader	❌ 仅查看	❌ 无	⚠️ 中等（文件可控）	离线、无 Server
嵌入网页	✅ 完整	✅ 继承 Server	✅ 高	内网门户、系统集成

权限与安全最佳实践

最小权限原则：只给必要权限（如普通用户仅「交互式查看」）
项目管理：按部门 / 业务线建项目，统一权限继承
行级别安全（RLS）：用用户函数 USERNAME() 做数据过滤，确保用户只看自己的数据
禁用下载：对敏感报表关闭「下载工作簿 / 数据」能力
审计日志：开启访问日志，监控谁看了、何时看、导出了什么

面试 / 实操极简口诀

企业用 Server/Cloud，公开用 Public
离线用 .twbx + Reader
集成用 嵌入代码 + 白名单
权限：项目继承 + 最小权限 + RLS

Tableau 权限控制主要控制什么？

控制谁能看到什么内容、能做什么操作，核心是「可见范围 + 操作权限」两层管控。

控制「能看到什么」（数据权限）

项目 / 工作簿 / 视图权限

哪些用户 / 组能看到这个报表、文件夹
完全隐藏未授权内容

行级别权限（RLS，核心）

控制用户只能看到自己权限内的数据行
例如：
- 区域经理只看自己区域数据
- 业务员只看自己客户数据
常用函数：USERNAME()、ISMEMBEROF()

字段级别权限

隐藏敏感字段（手机号、成本、利润、身份证）
普通用户看不到，仅管理层可见

控制「能做什么操作」（功能权限）

查看权限

仅能看，不能交互、不能导出

交互权限

筛选、钻取、高亮、参数修改
但不能修改视图结构

下载 / 导出权限

是否允许下载数据、图片、PDF、工作簿
敏感报表通常关闭下载

编辑权限

是否允许修改工作表、仪表板、数据源
是否允许发布、覆盖、另存为

分享与注释权限

是否允许转发链接、添加评论

管理权限

创建项目、分配权限、设置刷新、管理用户

权限控制的对象（从大到小）

站点（Site）
项目（Project）
工作簿（Workbook）
数据源（Data Source）
视图 / 仪表板
数据行、数据字段

总结

Tableau 权限主要控制两块：

可见范围：哪些项目 / 报表 / 数据行 / 字段能看见
操作行为：能不能看、能不能交互、能不能下载、能不能编辑

什么是行级别安全 RLS？

RLS（Row-Level Security，行级别安全）：让同一份仪表板 / 数据源，在不同用户登录时，自动只显示其有权限的数据行，实现 “一人一视图、数据不越权”。

核心原理（必背）

本质：基于当前登录用户属性（用户名 / 用户组 / 部门 / 区域），在数据查询 / 聚合前动态过滤行，只返回授权数据。

与普通权限区别：

普通权限：控制能否打开 / 编辑 / 下载工作簿（功能级）。
RLS：控制打开后能看到哪些数据行（数据级）。

典型场景：区域经理只看本区域、销售只看自己客户、医生只看自己患者。

Tableau 实现 RLS 的 4 种主流方法（面试高频）

1. 用户筛选器（User Filter，最常用，Desktop 即可做）

原理：用 USERNAME()/ISMEMBEROF() 函数匹配数据字段，动态过滤。步骤：

1. 数据源含权限字段（如 Region、Salesperson、Dept）。

2. 创建计算字段：

// 例1：用户只能看自己负责的区域
[Region] = USERNAME()
// 例2：用户属于"华东组"则看华东数据
[Region] = "华东" AND ISMEMBEROF("华东组")

3. 将计算字段拖到筛选器，勾选 True。

4. 发布到 Server/Cloud，禁止用户编辑 / 下载数据源（防止绕过）。

2. 数据策略（Data Policy，Server/Cloud + Data Management）

适用：2021.4+，虚拟连接（Virtual Connection），数据源级统一 RLS。

步骤：

Server 启用 Data Management，创建虚拟连接。
添加数据策略，指定策略表、映射字段、策略条件（如 [Region] = USERNAME()）。
所有用该虚拟连接的工作簿自动继承 RLS，无需逐个设置。

3. 数据库内置 RLS（Live 连接专用）

原理：复用数据库（SQL Server/PostgreSQL/ Snowflake）自带的 RLS，Tableau 仅传递用户身份Tableau。

实现：

数据库端创建行级安全策略 / 视图，按数据库用户过滤Tableau。
Tableau 用模拟登录 / Kerberos/ Initial SQL 传递当前用户（如 EXECUTE AS USER = [TableauUser]）。
优势：安全策略统一在数据库维护，Tableau 无额外配置。

4. 权利表（Entitlement Table，复杂多维度权限）

原理：用专门的权限映射表（用户 → 可访问维度值），与事实表关联后过滤。

SQL 示例：

SELECT d.*
FROM 事实表 d
JOIN 权利表 e
  ON d.Region = e.Region AND d.Dept = e.Dept
WHERE e.Username = USERNAME()

优势：支持多维度、复杂权限矩阵（如用户 A 看华东 + 销售部，用户 B 看华北 + 市场部）。

三、关键函数

USERNAME()：返回当前登录用户的用户名（如 zhangsan@company.com）。
FULLNAME()：返回用户全名。
ISMEMBEROF("组名")：判断用户是否属于指定用户组（返回 True/False）。
USERDOMAIN()：返回用户域（AD 环境）。

四、RLS 执行顺序

数据库 RLS/Initial SQL（最早）
数据策略（虚拟连接）
数据源级用户筛选器
工作簿级用户筛选器
普通筛选器 / LOD / 表计算（最晚）

总结

RLS = 同报表、不同人、看不同行，核心是动态行过滤Tableau。
实现：用户筛选器（Desktop）、数据策略（Server）、数据库内置、权利表Tableau。
关键函数：USERNAME()、ISMEMBEROF()。
目的：数据合规、权限隔离、一份报表多人用。

什么是仪表板布局？

仪表板布局就是对图表、筛选器、文字、图片等内容进行排版、定位、排列方式的设置，用来控制整个页面的结构、大小和展示效果。

两种主要布局方式

1. 平铺布局

所有元素按网格整齐排列，不重叠
会自动适应、自动对齐
结构规范，不容易乱

2. 浮动布局

元素可以自由拖动、重叠摆放
位置和大小可以精确控制
适合做更灵活、更有设计感的页面

常用布局容器

水平容器：内部内容左右排列
垂直容器：内部内容上下排列
可以多层嵌套，实现复杂分栏结构

页面大小设置

固定大小：页面尺寸不变，适合精准排版
范围大小：在一定区间内自适应缩放
自动大小：铺满整个显示窗口

总结

布局就是怎么摆放页面上的所有内容，平铺规整通用，浮动自由灵活，容器用来分区排版。

Tableau 中工作表与仪表板的区别

1. 工作表（Worksheet）

是单个图表 / 视图的编辑页面，用来制作一张具体的图。
一个工作表里只有一种图表类型（柱状图、折线图、饼图、地图等）。
主要用于维度、度量、筛选、计算的单独设计与调试。

2. 仪表板（Dashboard）

是多个工作表的容器，用来把多张图表组合在一个页面展示。
可以统一布局、排版，实现交互联动（筛选一个图表，全部跟着变化）。
面向最终使用者，用于整体业务监控、数据看板。

总结

工作表是单张图表，仪表板是多张图表的组合页面；工作表负责制作，仪表板负责展示与联动。

如何实现点击图表跳转到另一个仪表板？

打开需要设置点击跳转的源仪表板，进入动作设置
新建动作，选择跳转到工作表 / 仪表板
选择触发方式为点击选择
指定要跳转到的目标仪表板
设置是否传递筛选条件，让跳转后自动按点击内容过滤数据
确定保存，点击图表即可实现跳转

如果需要固定按钮跳转：

在仪表板中添加导航按钮
编辑按钮，绑定目标仪表板
自定义样式后完成设置

如何让多个工作表共用一个筛选器？

把筛选器直接放到仪表板上，而不是单独放在某个工作表里
在筛选器上点开下拉菜单，选择应用到工作表
选择选定工作表，勾选所有需要共用筛选的表
或者直接选应用到此仪表板中的所有工作表，一键全局生效

仪表板如何实现联动？

通过筛选器全局应用 + 仪表板操作（动作），实现点击一个图表，其他图表同步筛选或高亮。

使用全局筛选器联动

添加筛选器时，选择 应用到工作表 → 选定工作表 / 全部工作表
多个图表共用同一个筛选器，实现统一过滤

使用 “操作” 实现点击联动（最常用）

进入仪表板 → 顶部菜单 仪表板 → 操作
点击 添加操作 → 筛选 / 高亮
选择源工作表（点哪个图）、目标工作表（哪些图跟着变）
设置触发方式：鼠标悬停或鼠标点击

效果

点击一个图表的某个类别
其他图表自动只显示对应数据（筛选联动）或
对应内容高亮显示，其他变灰（高亮联动）

Tableau 仪表板变慢如何优化？

减少数据量、简化计算、优化数据源、减少冗余视图，从源头到展示层层减负。

1. 优先做：减少数据量（最见效）

使用数据提取（Extract .hyper），替代直连数据库
加提取筛选器 / 数据源筛选，只加载需要的年份、区域
避免加载全量明细，尽量聚合后再进 Tableau
对超大数据集使用数据滚动窗口（只保留最近 N 个月）

2. 优化计算：少用慢计算

减少复杂 LOD、嵌套表计算、多重 RUNNING_SUM
能在 SQL / 数据仓库算的指标，不要在 Tableau 里算
避免对大维度字段做 COUNTD、COUNTD（性能杀手）
合理使用 上下文筛选 减少计算范围

3. 简化仪表板与视图

一个仪表板不要放太多图表（建议 ≤8～10 张）
删掉无用的参考线、标注、复杂 tooltip
避免大量动画、实时刷新、自动播放
地图尽量少用高精度背景地图，改用简化图层

4. 优化筛选与交互

减少全局筛选、联动筛选的数量
大数据量必开 上下文筛选
避免多个筛选器同时触发大量计算
关闭不必要的高亮联动

5. 数据源与 Server 端优化

建立索引（日期、区域、常用关联字段）
直连数据库时，避免复杂视图、多表联查
Tableau Server 上调整并发查询、刷新错开高峰
定期优化 Extract 刷新，避免全量刷新

6. 其他小技巧

关闭 自动更新数据预览
隐藏暂时不用的工作表
避免使用大量自定义图片、背景图
升级 Tableau 版本、增加服务器资源

如何快速定位哪个视图最慢？

快速定位最慢视图，优先用性能记录（Desktop）、管理视图（Server）、RMT/Admin Insights 三种方式，按场景选择即可。

一、Desktop：本地快速排查（最常用）

适合开发 / 测试时，直接在本地定位慢视图。打开目标工作簿 → 菜单帮助 → 设置和性能 → 启动性能记录正常操作：打开所有仪表板、切换视图、触发筛选 / 交互操作完成 → 帮助 → 设置和性能 → 停止性能记录

自动生成性能记录工作簿：

性能摘要：按总耗时排序，一眼看到最慢视图
详细视图：拆解耗时（查询、渲染、布局、数据提取等）

可保存为 .twbx，用于后续分析。

二、Server：线上全局定位（管理员 / 发布后）

1. 内置管理视图（免费，无需额外工具）

路径：Server → 状态 → 管理视图 → 加载时间统计数据功能：

按平均加载时间排序，列出所有视图
筛选站点、工作簿、时间范围
用加载时间滑块过滤（如 > 5 秒），直接锁定慢视图
下钻查看确切加载时间与请求详情

2. 视图性能管理视图

路径：Server → 状态 → 管理视图 → 视图性能功能：对比加载时间峰值与并发会话数，判断是单视图慢还是整体负载高

三、Server 高级监控（RMT/Admin Insights）

适合大规模、长期性能监控。

Resource Monitoring Tool (RMT)

打开性能 → 最慢的视图图表
按平均加载时长排序
筛选时间范围（默认 2 周），定位高频慢视图

Admin Insights /ts_web_requests 日志

连接 ts_web_requests 数据源
筛选：平均加载时间 > 阈值且请求次数 > 阈值
按工作簿 / 视图分组，找出 TOP N 慢视图

四、快速判断慢因（定位后）

查询慢：实时连接、复杂计算 / LOD、大表未聚合 → 改用数据提取、优化 SQL、预聚合
渲染慢：标记过多、复杂表计算、多视图同屏 → 精简标记、优化表计算、拆分仪表板
交互慢：筛选器过多、跨数据源筛选、未用加速视图 → 合并筛选、启用加速视图

五、方法对比（速查）

方式	适用场景	优点	缺点
性能记录（Desktop）	本地开发 / 测试	即时、详细、无权限	仅本地，不反映线上真实负载
管理视图（Server）	线上全局监控	免费、内置、易操作	数据粒度有限
RMT/Admin Insights	大规模 / 长期运维	全面、可告警、趋势分析	需部署 / 权限、配置复杂

六、最快操作流程（推荐）

本地先用性能记录定位可疑慢视图
发布后用 Server 加载时间统计验证线上表现
批量问题用 RMT/Admin Insights 做全局扫描

COUNTD 为什么慢？如何优化？

一、为什么 COUNTD 慢

COUNTD 是去重计数，必须扫描所有数据、比对每一条记录是否重复，计算成本很高：

无法用简单索引加速，需要全量数据遍历
数据量越大、唯一值越多，耗时呈指数上升
实时连接数据库时，会生成复杂子查询，数据库执行压力大
多表关联后再去重，会产生大量中间计算

二、优化方法（按效果从强到弱）

1. 使用数据提取（Extract）

提取会对去重做本地优化，速度远快于实时连接

2. 在数据源层面提前去重

在数据入库前做聚合，只保留汇总结果，不再原始明细计算

3. 减少数据范围

先过滤时间、区域等维度，缩小计算数据集再 COUNTD

4. 用 LOD 提前聚合

用 FIXED 等表达式提前按维度聚合，降低明细数据量

5. 数据库侧预计算

在 SQL / 视图 / 存储过程中先算好去重计数，再加载

6. 避免在复杂仪表板中多次使用 COUNTD

多个工作表共用同一个 COUNTD 结果，不重复计算

总结

COUNTD 慢是因为全量遍历 + 去重比对；优化核心：提前聚合、减少数据量、使用数据提取、数据库预计算。

项目权限的“锁定”和“解锁”是什么？

项目权限的 “锁定” 和 “解锁”，简单说就是控制子内容能不能单独改权限：

锁定

项目里所有工作簿、视图、子项目统一使用项目权限
不能单独给某个文件单独设置权限
修改项目权限后，整个项目下所有内容权限会一起同步更新
适合需要统一管理、权限严格一致的场景

解锁

项目权限只是初始默认值
可以单独给某个工作簿、视图设置独立权限
修改项目权限，不会影响已经设置过独立权限的内容
适合需要灵活分配、单独管控个别内容的场景

核心区别

锁定：统一权限，禁止单独修改，全局同步
解锁：默认继承，允许单独设置，不同步已有内容

如何禁止用户下载原始数据？

禁止用户下载原始数据，核心是在 Tableau Server/Online 上关闭 查看底层数据、下载完整数据 等权限，并配合项目锁定、数据提取、行级安全加固。

一、核心权限控制（最关键）

1. 项目级统一设置（推荐，批量生效）

1. 进入目标项目 → 点击权限 → 右上角 编辑内容权限

2. 选择用户 / 组 → 切换到 工作簿 权限页

3. 关闭以下权限（设为拒绝）：

查看数据（禁止查看底层明细）
下载完整数据（禁止导出原始 CSV）
下载数据源（禁止下载 TDSX / 数据源文件）

4. 可选：保留 下载摘要数据（仅允许聚合数据导出）

5. 保存 → 选择 锁定到项目（强制所有内容继承，防止单独修改）

2. 工作簿 / 视图级单独设置（精细化）

1. 打开工作簿 → 右上角 ⋯ → 权限

2. 对目标用户 / 组，关闭：

查看数据
下载完整数据

3. 保存（仅影响当前工作簿）

3. 数据源级控制（源头管控）

进入数据源 → 权限
关闭 下载数据源、连接（按需）
发布时选择 已发布数据源，并限制连接权限

二、关键权限说明（必关项）

权限项	作用	禁止后效果
查看数据	允许用户右键 “查看数据” 看明细	隐藏 “查看数据” 按钮，无法看原始行
下载完整数据	允许导出全部原始数据（CSV）	禁用 “导出→完整数据”
下载数据源	允许下载 TDSX / 数据源文件	无法下载数据源本地打开
下载摘要数据	仅导出视图聚合数据	可保留（不泄露原始明细）

三、加固方案（彻底防泄露）

1. 锁定项目权限（防止绕开）

项目权限设为 锁定到项目 → 内容所有者无法单独修改权限
确保所有子项目统一管控

2. 改用数据提取（隐藏原始连接）

发布前创建 数据提取（Extract）
提取时：
- 隐藏敏感字段
- 做预聚合（SUM/COUNT），不保留明细
- 禁用 “包含所有行”

3. 行级安全（RLS）+ 数据脱敏

用 用户筛选器 限制可见数据范围
敏感字段（身份证、手机号）做脱敏显示
禁止用户查看 / 导出未脱敏字段

4. 站点级全局策略（管理员）

1. 站点 → 设置 → 内容与性能

2. 关闭：

允许用户下载工作簿
允许用户下载数据源
允许用户查看底层数据（全局）

四、操作路径速查

项目级（批量）

项目 → 权限 → 编辑内容权限 → 工作簿 → 拒绝【查看数据 / 下载完整数据】→ 锁定项目

工作簿级（单个）

工作簿 → ⋯ → 权限 → 拒绝【查看数据 / 下载完整数据】

数据源级

数据源 → 权限 → 拒绝【下载数据源 / 连接】

站点全局（管理员）

站点 → 设置 → 内容与性能 → 关闭下载 / 查看数据选项

五、常见误区与最佳实践

❌ 只关 “下载”，不关 “查看数据”：用户仍可复制明细
❌ 不锁定项目：内容所有者可单独开权限
✅ 优先项目级 + 锁定：统一、可审计、不易出错
✅ 敏感数据：提取 + 聚合 + RLS 三重防护
✅ 审计：开启日志，监控下载 / 查看数据行为

报表如何自动定时发送？

报表自动定时发送，核心是使用订阅功能，按固定周期把视图 / 工作簿以邮件 + 图片 / PDF 附件的形式自动发给指定用户或用户组。

一、前提条件（必须满足）

报表已发布到服务器平台（本地桌面端无法订阅）
管理员已配置 SMTP 邮件服务、开启站点订阅功能
收件人账号已绑定邮箱，并且拥有报表查看权限
管理员已创建可用的定时计划（每日 / 每周 / 每月）

二、操作步骤（订阅单个视图 / 工作簿）

1. 登录服务器平台，打开目标视图 / 工作簿

2. 点击顶部工具栏的订阅按钮（邮件图标）

3. 在弹窗中配置：

收件人：添加用户 / 组（支持批量）
内容范围：仅当前视图 / 整个工作簿
计划：选择管理员预设的定时计划（如每日 9 点、每周一）
邮件设置：自定义标题、添加正文说明

4. 高级选项：

勾选 “不发送空视图”（数据为空时不发邮件）
勾选 “包含附件”（PDF / 图片，需管理员开启）

5. 点击订阅完成设置

三、管理员配置（关键前置）

1. 开启站点订阅

进入站点 → 设置 → 常规 → 订阅勾选：

允许用户订阅工作簿和视图
允许内容所有者为他人订阅
允许添加附件（PDF / 图片）设置发件人邮箱与邮件页脚

2. 创建定时计划（供用户选择）

管理员 → 计划 → 新建计划配置：

名称（如 “每日早报 9 点”）
频率：每日 / 每周 / 每月
时间、时区、执行间隔
关联任务类型：订阅通知

3. 权限检查

确保用户对报表有查看 + 下载图像 / PDF 权限
项目建议锁定，防止权限被单独修改

四、高级用法

1. 订阅筛选后视图（个性化）

先在视图上设置筛选器 → 保存为自定义视图对自定义视图订阅，收件人将收到筛选后的数据

2. 批量订阅（管理员 / 项目负责人）

进入项目 → 权限 → 右上角订阅批量为项目内所有报表设置统一订阅规则

3. 数据驱动告警（条件触发）

对数值指标设置阈值（如销售额 > 100 万）数据达标时自动发邮件 / 站内通知，适合异常监控

五、常见问题与排查

订阅按钮灰色：未发布到服务端、SMTP 未配置、站点未开启订阅、无权限
收不到邮件：检查邮箱、垃圾邮件、SMTP 配置、计划是否生效
附件缺失：管理员未开启 “允许添加附件”
数据不更新：需配置数据提取刷新计划，确保订阅用最新数据

六、最佳实践

统一计划：管理员预设标准计划（如每日 / 每周 / 月报），用户直接选用
锁定项目：项目权限锁定，确保所有报表继承统一订阅与权限
附件控制：敏感报表禁用附件，仅发图片 + 链接；常规报表可发 PDF
监控：管理员在后台任务中查看订阅执行状态与失败日志

Power BI

Power BI是什么？

Power BI 是微软推出的一套商业数据分析与可视化工具，用于把分散的业务数据进行连接、清洗、建模、分析，并制作交互式报表和仪表盘，帮助企业快速发现数据价值、辅助决策。

核心定位

自助式 BI 工具：业务人员也能自己做报表，不用完全依赖 IT
一站式数据平台：从取数 → 清洗 → 建模 → 可视化 → 分享全流程覆盖

三大核心组件

Power BI Desktop：本地免费开发工具，用于建模、写 DAX、制作报表。
Power BI Service：云端服务，用于发布、共享、计划刷新、协作、权限管理。
Power BI Mobile：手机 / 平板 App，随时随地查看仪表盘。

两个核心引擎

Power Query：数据获取、清洗、转换（ETL）
Power Pivot：内存建模 + DAX 计算引擎

主要能力

连接几乎所有数据源：Excel、SQL、MySQL、Oracle、Web、API、云端数据库等
强大的数据建模：支持星型模型、关系管理、度量值、计算列
丰富可视化：柱状图、折线图、地图、卡片、钻取、切片、联动交互
云端发布与共享：支持团队协作、行级别权限 RLS、定时自动刷新
轻量、易用、上手快，适合中小企业到大型企业使用

Power BI 核心组件有哪些？

Power BI 核心组件主要分为三大客户端 / 服务端产品 + 两大底层引擎，一共 5 个核心部分：

三大产品组件

Power BI Desktop

本地免费桌面端工具
用于数据连接、清洗、建模、写 DAX、制作报表

Power BI Service（服务 / 云端）

微软云平台上的 BI 服务
用于发布报表、分享协作、设置定时刷新、权限管理、查看仪表盘

Power BI Mobile

移动端 APP（iOS/Android）
用于随时随地查看、筛选报表和仪表盘

两大核心引擎

Power Query（M 语言）

负责数据获取、清洗、转换（ETL）
支持合并查询、追加、透视、数据类型转换等

Power Pivot + DAX

内存级数据建模引擎
负责建立表关系、度量值、计算列，实现复杂数据分析

Report与Dashboard的区别？

Report（报表）

多页画布，由多个视觉对象组成
支持交互、筛选、钻取、交叉高亮
可以使用 DAX、计算列、度量值
用于详细分析、业务复盘

Dashboard（仪表盘）

只有一页，由从报表固定过来的 “磁贴” 构成
交互很弱：只能点击跳转，不能筛选、不能钻取
不能写 DAX，只做展示
用于高层监控、关键指标概览

什么是语义模型？

语义模型 = 对原始数据做 “业务化封装” 的逻辑层，让报表、用户不用关心数据库表结构，直接用业务语言做分析。

把复杂的数据库表、关系、字段名，转换成业务能看懂的指标、维度、名称、关系，并统一计算逻辑、权限、格式。

核心作用

统一口径

所有报表共用一套 “销售额、毛利、订单数” 定义，不会出现 A 报表和 B 报表算出来不一样。

简化使用

业务人员不用写 SQL/DAX，直接拖字段就能做报表。

封装复杂逻辑

把关联、筛选、时间计算、权限等复杂逻辑藏在模型里，对外只暴露简单指标。

一次建模，多处复用

一个语义模型可以给：Power BI 报表、分页报表、Excel、第三方工具共用。

Power BI 连接模式是什么？如何选择？

Power BI 主流有 3 种基础连接模式 + 复合 / 混合模式，核心区别在数据是否导入、实时性、性能、建模能力。

三大基础连接模式（核心对比）

1. Import（导入模式，默认）

原理：将数据完整加载到 Power BI 内存引擎（VertiPaq），本地 / 云端存储数据副本。
数据实时性：非实时，需手动 / 定时刷新（增量 / 全量）。
性能：极快，交互响应秒级。
建模能力：完全支持 DAX、计算列、度量值、复杂关系、时间智能。
限制：数据集大小受限（免费版 1GB，Pro 版 10GB）。
适用场景：中小型数据集、离线分析、需要复杂建模、追求极致交互速度。

2. DirectQuery（直接查询）

原理：不存储数据，仅存元数据；交互时实时向源数据库发 SQL 查询。
数据实时性：准实时，所见即最新。
性能：依赖源数据库性能，交互有延迟。
建模能力：受限，不支持计算列、部分 DAX 函数、复杂关系。
限制：数据源需支持（SQL Server、Oracle、Snowflake 等），高并发会压源库。
适用场景：超大数据集、需实时数据、源库性能强、不想频繁刷新。

3. Live Connection（实时连接）

原理：直连 SSAS/Azure Analysis Services 等企业级语义模型，复用已有模型。
数据实时性：实时，依赖源模型缓存。
性能：快，复用源模型优化。
建模能力：无建模权，只能用源模型已定义的度量 / 维度。
限制：仅支持 SSAS 等分析服务，不能自定义模型。
适用场景：企业已有统一数据模型、需强治理、多人复用同一模型。

复合 / 混合模式（进阶）

Composite Model（复合模型）：同一报表混合 Import + DirectQuery，部分表导入、部分直连。
Hybrid Tables（混合表）：单表分分区，热数据 DirectQuery、冷数据 Import，兼顾实时与性能。
Direct Lake（Fabric 专属）：直连 Lakehouse，绕过刷新、保留 Import 性能，适合大数据湖。

如何选择（面试必背决策树）

1. 优先选 Import（绝大多数场景）

数据量 ≤10GB、需要复杂 DAX / 建模、追求交互速度、离线可用。

2. 选 DirectQuery

数据量极大（TB 级）、必须实时、源库性能好、不想频繁刷新。

3. 选 Live Connection

企业已有 SSAS/AAS 统一模型、强数据治理、复用现有度量。

4. 选复合 / 混合

既要实时热数据、又要历史数据性能、多源混合分析。

总结

Import：数据导入内存、性能最快、建模最全、非实时，适合中小数据集。
DirectQuery：不存数据、实时查询、性能依赖源库、建模受限，适合大数据实时场景。
Live Connection：直连 SSAS、实时、复用模型、无建模权，适合企业统一模型场景。

什么是 DAX？

DAX（Data Analysis Expressions） 是微软为 Power BI、Power Pivot、SSAS 设计的公式与查询语言，专门用于对数据模型进行计算、聚合、筛选和分析。

简单说：DAX 就是 Power BI 里做复杂计算的 “公式语言”。

核心特点

不是编程语言，是公式语言类似 Excel 函数，但更强大，面向数据模型、表与关系。

区分筛选上下文 & 行上下文这是 DAX 最核心、面试最爱问的概念。

主要用来写两种对象

计算列（Calculated Column）：行级别计算
度量值（Measure）：聚合与动态计算

有大量内置函数

聚合：SUM、COUNT、AVERAGE
筛选：CALCULATE、FILTER、ALL
时间智能：DATEADD、SAMEPERIODLASTYEAR、TOTALYTD
逻辑与文本：IF、AND、OR、CONCATENATE

DAX常用函数及其作用？

一、聚合函数

SUM：对列求和

SUM(Sales[Amount])

AVERAGE：求平均值

COUNT / COUNTA / COUNTBLANK：计数、非空计数、空值计数

MIN / MAX：最小、最大值

二、迭代函数（逐行计算）

SUMX：逐行计算表达式，再求和

SUMX(Sales, Sales[Price] * Sales[Qty])

MAXX / MINX / AVERAGEX：迭代求最大、最小、平均

三、筛选核心函数

CALCULATEDAX：最重要函数，修改筛选上下文

CALCULATE(SUM(Sales[Amount]), Sales[Region]="华东")

FILTER：对表进行行级筛选

ALL：清除所有筛选

ALLEXCEPT：保留某些列筛选，清除其他

ALLSELECTED：获取当前页面选中的筛选

VALUES / DISTINCT：返回不重复值列表

四、逻辑与判断

IF：条件判断

AND / OR / NOT：

ISBLANK：判断是否为空

COALESCE：空值替换

五、时间智能函数（必考）

SAMEPERIODLASTYEAR：去年同期

DATEADD：日期偏移

DATESYTD / TOTALYTD：年初至今累计

DATESMTD：月初至今

PREVIOUSMONTH：上个月

六、排名与统计

RANKX：排名（TopN 产品、区域）

DIVIDE：安全除法，避免除零错误

七、关系与上下文

RELATED：从关联维度表取数

EARLIER：获取外层行上下文

计算同比、环比、累计销售额、年度累计？

同比（YoY）

销售额 同比 = 
VAR 当前值 = [销售额]
VAR 去年同期 = CALCULATE([销售额], SAMEPERIODLASTYEAR('日期表'[日期]))
RETURN
DIVIDE(当前值 - 去年同期, 去年同期)

环比（MoM）

销售额 环比 = 
VAR 当前值 = [销售额]
VAR 上月 = CALCULATE([销售额], DATEADD('日期表'[日期], -1, MONTH))
RETURN
DIVIDE(当前值 - 上月, 上月)

累计销售额（所有时间）

累计销售额 = 
CALCULATE(
    [销售额],
    FILTER(
        ALLSELECTED('日期表'),
        '日期表'[日期] <= MAX('日期表'[日期])
    )
)

年度累计（YTD）

年度累计销售额 = TOTALYTD([销售额], '日期表'[日期])

CALCULATE函数作用与语法？

1. 作用

CALCULATE 是 DAX 中最核心、最重要的函数。

它的核心作用：执行表达式，并修改筛选上下文。

简单理解：

先按你给的条件改变筛选范围
再在新的筛选范围内计算表达式

它是实现同比、环比、占比、条件聚合的基础。

2. 语法

CALCULATE( <表达式>, <筛选条件1>, <筛选条件2>, ... )

<表达式>：通常是聚合函数，如 SUM、COUNT、AVERAGE 等
<筛选条件>：可以是列条件、表筛选、ALL/ALLEXCEPT 等

3. 简单示例

华东销售额 = 
CALCULATE(
    SUM(Sales[金额]),
    Sales[区域] = "华东"
)

含义：只计算 “华东” 区域的销售总额。

总结

CALCULATE 用于修改筛选上下文，在指定的筛选条件下执行聚合计算，是 DAX 最核心函数。

CALCULATE 执行顺序？

先修改筛选上下文 → 再计算表达式

1. 保存外部原来的筛选上下文

2. 执行所有筛选参数，生成新的筛选上下文

添加筛选
删除筛选（ALL/REMOVEFILTERS）
修改关系（USERELATIONSHIP）
跨表筛选（CROSSFILTER）

3. 在新的筛选上下文里，执行第 2 个参数的表达式

4. 恢复原来的上下文

销售额_华东 = 
CALCULATE(
    [销售额],          // ③ 最后计算
    区域[地区] = "华东"  // ② 先应用筛选
)

总结

CALCULATE 先处理所有筛选条件，构建新的筛选上下文，再在新上下文下执行聚合计算。

度量值（Measure）与计算列（Calculated Column）区别？

计算列：在数据刷新时计算，结果存在表里，占空间，用行上下文。
度量值：在报表交互时动态计算，不存数据，用筛选上下文。

计算列（Calculated Column）

计算时机：数据刷新 / 建模时计算一次
存储方式：结果保存在模型中，占用内存 / 磁盘空间
上下文：默认是行上下文，可以直接引用本行字段
筛选：不受报表切片器、筛选器影响
用途：行级固定逻辑，比如：
- 利润 = 售价 - 成本
- 客单价区间 = 高 / 中 / 低
性能：计算一次，查询快；但数据量大时会膨胀模型

度量值（Measure）

计算时机：报表筛选、交互、可视化时实时动态计算
存储方式：只存公式，不存储结果
上下文：受筛选上下文影响（切片器、图表、行 / 列维度都会改变结果）
用途：聚合与动态分析，比如：
- 总销售额 = SUM (金额)
- 同比、环比、占比、累计
性能：计算快，不占存储空间；复杂 DAX 可能影响报表速度

总结

计算列：行上下文、刷新时计算、结果存在表中、占用空间、不受筛选器影响。
度量值：筛选上下文、交互时动态计算、不存结果、不占空间、随筛选变化。

SUM与SUMX区别？

SUM：直接对一列数值求和，简单聚合，性能高。
SUMX：逐行迭代计算，先算每行的表达式，再把结果求和，适合需要行级计算的场景。

SUM

语法：SUM(表[列])
只能对已存在的列求和
不支持行级计算逻辑
性能更好

示例：

总销量 = SUM(Sales[数量])

SUMX

语法：SUMX(表, 每行要计算的表达式)
先遍历表的每一行，计算表达式
再把所有行的结果累加
支持行与行之间的运算（如单价 × 数量）

示例：

总销售额 = SUMX(Sales, Sales[单价] * Sales[数量])

总结

SUM：直接聚合一列，简单、快，不能做行级计算。
SUMX：迭代函数，逐行计算再求和，支持复杂行逻辑，功能更强。

ALL/ALLEXCEPT/ALLSELECTED区别？

这三个都是修改筛选上下文的核心函数，主要用来清除或保留外部筛选。

1. ALL (表 / 列)

作用：清除指定表或列上的所有筛选器
无视页面切片器、图表维度、行 / 列分组，直接看全部数据
常用于计算占比、总计

示例：

总销售额 = CALCULATE(SUM(金额), ALL(Sales))

2. ALLEXCEPT (表，保留列 1, 保留列 2...)

作用：清除表上除指定列以外的所有筛选
保留你指定的维度筛选，其他全部忽略
适合按某维度分组求分组总计

示例：

各区域总计 = CALCULATE(SUM(金额), ALLEXCEPT(Sales, Sales[区域]))

3. ALLSELECTED()

作用：清除内部筛选，保留用户在页面上手动选择的外部筛选
只认切片器、筛选器的选择，不受图表内部行列分组影响
最常用于占比（占当前所选的百分比）

总结

ALL：全部都不要筛选，看整体总数
ALLEXCEPT：除了某几个维度，其他筛选都去掉
ALLSELECTED：保留用户选的筛选，去掉图表内部分组筛选

时间智能函数怎么用？

时间智能函数必须配合连续、无重复、完整的日期表使用，否则会出错。

一、常用时间智能函数（必考）

1. 去年同期（同比）

销售额_去年同期 = 
CALCULATE(
    [总销售额],
    SAMEPERIODLASTYEAR('日期表'[日期])
)

2. 年初至今累计（YTD）

销售额_YTD = 
TOTALYTD([总销售额], '日期表'[日期])

3. 月初至今累计（MTD）

销售额_MTD = 
TOTALMTD([总销售额], '日期表'[日期])

4. 上个月

销售额_上月 = 
CALCULATE(
    [总销售额],
    PREVIOUSMONTH('日期表'[日期])
)

5. 日期偏移（前 N 天 / 月 / 年）

销售额_上月同期 = 
CALCULATE(
    [总销售额],
    DATEADD('日期表'[日期], -1, MONTH)
)

必须建标准日期表：连续、无缺失、标记为日期表
不能用事实表日期：否则时间智能计算异常
核心场景：同比、环比、累计、同期对比

总结

SAMEPERIODLASTYEAR：去年同期
TOTALYTD / TOTALMTD：年 / 月累计
PREVIOUSMONTH：上个月
DATEADD：日期偏移必须配合标准日期表使用。

如何实现年度重置的累计值？

核心思路：

使用 CALCULATE + FILTER 限定时间范围
用 EARLIER 或变量获取当前行的年份
只累加同年且日期 ≤ 当前日期的数据
必须使用标准日期表

DAX 公式（计算列写法）

年度累计销售额 = 
CALCULATE(
    SUM(Sales[Amount]),
    FILTER(
        ALL('Date'),
        'Date'[Year] = EARLIER('Date'[Year]) &&
        'Date'[Date] <= EARLIER('Date'[Date])
    )
)

解释

ALL('Date')：清除日期筛选，保证全局计算
'Date'[Year] = EARLIER('Date'[Year])：只保留同一年，实现年度重置
'Date'[Date] <= EARLIER(...)：只累加当天及之前的数据

度量值写法（更常用）

年度累计 = 
VAR CurrentDate = MAX('Date'[Date])
VAR CurrentYear = MAX('Date'[Year])
RETURN
CALCULATE(
    [总销售额],
    FILTER(
        ALLSELECTED('Date'),
        'Date'[Year] = CurrentYear &&
        'Date'[Date] <= CurrentDate
    )
)

总结

使用 CALCULATE + FILTER，通过年份判断实现每年重置，只累加同年且小于等于当前日期的数据，配合日期表使用。

EARLIER 作用？

EARLIER 用于获取「外层行上下文」的值，解决嵌套计算中 “内外层区分” 的问题。

在嵌套迭代（如嵌套 SUMX、FILTER、ADDCOLUMNS）里，

内层默认只能看到内层的行
用 EARLIER(列名) 可以引用外层那一行的值

典型场景

计算列中的排名
按分组累计（年度 / 月度重置累计）
嵌套筛选时引用外层字段

简单示例

排名 = 
RANKX (
    '表',
    EARLIER ( '表'[销售额] ),
    ,
    DESC
)

这里 EARLIER 就是为了拿到当前行的销售额，和整表比较排名。

总结

EARLIER 用于嵌套行上下文中，引用外层行的值，常用于排名、分组累计、嵌套筛选等场景。

SELECTEDVALUE 作用？

SELECTEDVALUE 用于获取当前筛选上下文里的 “单个值”，如果有多个值或没有值，会返回指定的默认值（通常为空）。

核心用途

读取切片器、筛选器当前选中的内容
做动态标题、动态提示、动态计算
避免多值时出现报错

语法

SELECTEDVALUE(列名, [默认值])

简单示例

切片器只选了 “华东”：SELECTEDVALUE(区域[区域名]) → 返回华东
没选任何值：SELECTEDVALUE(区域[区域名], "未选择区域") → 返回未选择区域
多选了 “华东、华北”：返回默认值（空或你指定的文字）

VALUES 与 DISTINCT 区别？

VALUES：返回不重复值 + 可能返回因关系产生的空行
DISTINCT：只返回真正存在的不重复值，不会多出空行

VALUES (列)

返回该列所有不重复的值
当表之间关系不完整时（如事实表有维度表不存在的 ID），会自动多返回一行空值
常用于需要匹配关系的筛选、计数

DISTINCT (列)

只返回数据源中实际存在的不重复值
不会额外返回空行，结果更 “纯粹”
适合单纯去重、统计唯一数量

总结

VALUES 会包含关系产生的空行，DISTINCT 只返回实际存在的去重值，不会多出空行。

什么是行上下文、筛选上下文？

1. 筛选上下文（Filter Context）

是什么：一组 “筛选条件” 构成的环境，决定哪些行可见。
来自哪里：切片器、页面筛选、视觉筛选、CALCULATE 内部条件。
特点：全局生效，对整个度量 / 计算起过滤作用。

筛选上下文 = 过滤范围。

2. 行上下文（Row Context）

是什么：逐行迭代时，当前行的环境。
来自哪里：计算列、SUMX / FILTER / MAXX 等迭代函数。
特点：只针对当前一行，知道这一行的字段值。

行上下文 = 当前行。

3. 最经典区分例子

总销售额 = SUM(表[金额])    // 用的是筛选上下文
行计算 = SUMX(表, [单价] * [数量])  // 内部是行上下文

4. 总结

筛选上下文：决定哪些行可见，来自切片器、筛选、CALCULATE。
行上下文：迭代时当前行的环境，用于逐行计算。

什么是上下文转换？

上下文转换 = 行上下文自动转换成筛选上下文

当在行上下文（计算列、SUMX、FILTER 里）直接调用度量值时，DAX 会自动把 “当前这一行” 变成筛选条件，这就叫上下文转换。

典型场景

计算列中引用度量值
迭代函数（SUMX、MAXX）内部调用度量值

简单例子

行销售额 = [总销售额]

这是计算列，本身处于行上下文
但 [总销售额] 是度量，需要筛选上下文
所以 DAX 自动把当前行的维度（产品、日期等）变成筛选，去计算对应值

总结

在行上下文里调用度量时，DAX 自动将当前行转为筛选条件，这个过程就是上下文转换。

切片器如何实现多选、搜索、树形结构？

多选（Multi-select）

1. 开启多选（默认关闭）

选中切片器 → 右侧「格式」→「切片器设置」→「选择」
关闭「单选」（Single select），即可直接点选多个值（无需 Ctrl）
多选逻辑：默认OR（满足任一）；如需AND（同时满足），用 DAX 或双向筛选

2. 多选常用操作

点选：直接点击多个选项
全选 / 反选：点击切片器顶部「全选」
清除：点击「清除选择」

搜索（Search）

1. 开启搜索（原生支持）

选中切片器 → 「格式」→「切片器设置」→「常规」
打开「搜索」（Search），切片器顶部出现搜索框
输入关键词，自动过滤匹配项（支持模糊匹配）

2. 适用场景

长列表（如省份、产品、客户）
树形 / 层级切片器（搜索穿透所有层级）

树形 / 层级结构（Hierarchy）

1. 两种实现方式（推荐：直接拖入多字段）

方式 1：直接拖入多字段（最快）

插入「列表切片器」（List Slicer，预览功能需先开启：文件→选项和设置→选项→预览功能→勾选「List Slicer visual」）
按层级顺序拖入字段（如：国家→省份→城市、类别→子类别→产品）
自动生成树形，可展开 / 折叠，支持多选 + 搜索

方式 2：先创建层次结构（模型层）

数据窗格 → 右键顶级字段（如「类别」）→「创建层次结构」
右键下级字段（如「子类别」）→「添加到层次结构」→ 选择刚创建的层次结构
将层次结构拖入切片器，效果同上

2. 树形切片器格式优化

展开 / 折叠图标：格式→层次结构→展开 / 折叠→选择「V 形 / 加 / 减 / 脱字号」
缩进调整：格式→层次结构→级别→修改「渐变布局缩进」
混合状态样式：选中部分子项时，父项显示「混合」状态，可自定义颜色

总结

多选：关闭切片器「单选」，直接点选多值；默认 OR，AND 需 DAX / 双向筛选。
搜索：开启切片器「搜索」，顶部出现搜索框，支持模糊过滤。
树形：用列表切片器，按顺序拖入多层字段，自动生成可展开 / 折叠的层级，支持多选 + 搜索。

常见问题

1. 找不到列表切片器？

→ 开启预览功能：文件→选项→预览功能→勾选「List Slicer visual」，重启 Power BI

2. 树形不显示？

→ 确保用「列表切片器」，而非传统「切片器」；按层级顺序拖入字段

3. 多选是 OR，想改成 AND

？→ 用 DAX 度量值（如FILTER(表, 字段 IN {值1,值2})）或设置双向筛选

如何设置默认筛选/默认切片器值？

在 Power BI 中，默认筛选 / 切片器值分两种场景：固定默认值（打开就选好）、动态默认值（自动选最新 / 当前），以及默认不选。下面是最常用、最稳的方法（面试 + 实操版）。

固定默认值（最常用：书签法）

适合：打开报表时，切片器默认选中某几个固定值（如 “华东”“2025 年”）。

步骤

1. 在报表页，手动选中切片器要默认的选项（如 “华东”）。

2. 顶部菜单 → 视图 → 打开 书签窗格。

3. 点击添加，新建一个书签（命名如 “默认视图”）。

4. 右键该书签 → 设为默认状态。

5. 保存报表。

效果：每次打开 / 刷新，切片器自动选中你预设的选项。

动态默认值（自动选最新 / 当前）

适合：默认选中最新日期 / 当前月份 / 最新版本，随数据自动更新。

方法 1：DAX 度量值 + 高级切片器（推荐）

1. 新建度量值（返回 1 = 默认，0 = 非默认）

默认选中_当前月 = 
VAR 当前月 = MONTH(TODAY())
RETURN
IF(SELECTEDVALUE('日期表'[月份序号]) = 当前月, 1, 0)

2. 使用高级切片器（如 “切片器 Pro”）：

把字段拖入切片器。
格式 → 默认选择 → 选择上面的度量值。
应用后：自动选中当前月。

方法 2：DAX 计算列（原生切片器）

在维度表新增一列，标记默认项：

默认月份 = 
IF('日期表'[月份序号] = MONTH(TODAY()), "当前月", '日期表'[月份名称])

用 [默认月份] 做切片器，默认选中 “当前月”。

默认筛选（页面 / 所有页默认过滤）

适合：报表打开就自动过滤（如只看 “已完成” 订单）。

步骤

1. 右侧 筛选器 窗格 → 拖入字段（如 “订单状态”）。

2. 选中要默认的筛选值（如 “已完成”）。

3. 保存报表。

效果：打开报表时，该筛选自动生效；用户可手动清除。

默认 “不选任何值”（无默认）

适合：打开时切片器为空，用户手动选择。

步骤

选中切片器 → 格式 → 选择。
关闭 显示 “全选” 选项。
筛选器 → 默认值 → 选择 (无)。
保存。

什么是垂直筛选、水平筛选？

在 Power BI（DAX & 数据筛选）里，垂直筛选和水平筛选是两种最基础的筛选方式，用来描述按什么维度、怎么切数据，面试常考概念对比。

1. 垂直筛选（行筛选 / 筛选行）

定义：对表进行行级别过滤，只保留满足条件的行，减少行数。

本质：缩小行范围
关键词：WHERE、FILTER、CALCULATE 筛选条件、RLS 行权限

例子

CALCULATE([销售额], '产品'[类别] = "手机")

只保留 “产品类别 = 手机” 的那些行，其他行都过滤掉 → 垂直筛选。

垂直筛选 = 筛行，从上往下切，只留符合条件的行。

2. 水平筛选（列筛选 / 筛选列）

定义：只查询 / 展示表中的部分列，不改变行数，只减少列数。

本质：缩小列范围
关键词：SELECTCOLUMNS、SUMMARIZE、VALUES、查询投影

例子

SUMMARIZE('销售表', '日期'[年月], "销售额", [销售额])

只取出 “年月” 和 “销售额” 两列，其他列都不要 → 水平筛选。

水平筛选 = 筛列，从左往右切，只留需要的列。

类型	筛选对象	结果变化	典型函数
垂直筛选	行	行数变少	FILTER、CALCULATE、RLS
水平筛选	列	列数变少	SELECTCOLUMNS、SUMMARIZE、VALUES

总结

垂直筛选是按条件过滤行，水平筛选是只选择需要的列；一个控制行数，一个控制列数，共同决定最终查询的数据量。

如何实现用户选择日期范围计算？

一、最简单：直接用切片器 + 普通度量值

1. 放一个 日期切片器（Between / 介于）

2. 写正常度量值：

所选区间销售额 = SUM(销售表[金额])

3. 报表中用户拖动日期范围 → 度量值自动按筛选计算。

适用：绝大多数简单场景。

二、高级：独立日期表 + DAX 捕获所选范围（推荐）

如果你的日期需要不受其他筛选影响、或要做同期对比、同环比，用这种。

步骤

建一张独立日期表（标记为日期表）
用切片器放 日期表[日期]（Between）
用 DATESBETWEEN 捕获用户选择的起止：

所选范围销售额 = 
VAR StartDate = MIN(日期表[日期])
VAR EndDate   = MAX(日期表[日期])
RETURN
CALCULATE(
    [总销售额],
    DATESBETWEEN(日期表[日期], StartDate, EndDate)
)

优点：

可自由扩展：同期、环比、完成率、排名都能基于这两个变量写
不受其他筛选器干扰，逻辑干净可控

三、常用扩展：同期对比

所选范围同期销售额 = 
VAR StartDate = MIN(日期表[日期])
VAR EndDate   = MAX(日期表[日期])
VAR PY_Start  = EDATE(StartDate, -12)
VAR PY_End    = EDATE(EndDate, -12)
RETURN
CALCULATE(
    [总销售额],
    DATESBETWEEN(日期表[日期], PY_Start, PY_End)
)

总结

使用日期切片器让用户选择范围，通过 MIN/MAX 获取起止日期，再用 DATESBETWEEN 精确控制计算区间，可灵活实现范围汇总、同期、环比等需求。

星型模型与雪花模型区别？

星型模型：维度表不拆分，一层到底，结构像星星。
雪花模型：维度表继续规范化拆分，多层嵌套，结构像雪花。

星型模型（Star Schema）

结构：1 张事实表 + 多个直接关联的维度表
维度表：不拆分，冗余字段多（比如地区表直接存：省、市、区）
关系：简单清晰，都是一对多
查询：少关联，速度快
维护：简单，适合分析场景

雪花模型（Snowflake Schema）

结构：维度表继续拆分成子维度表
示例：地区表 → 省表 → 市表 → 区表
优点：减少冗余、节省存储
缺点：关联多、查询慢、复杂度高
适用：传统数据库规范化设计，不适合 BI 分析

Power BI 中推荐哪个？为什么？

强烈推荐星型模型

更符合 Power BI 引擎 VertiPaq 优化逻辑
减少表关系，提升查询与刷新性能
DAX 公式更简单、不易出错
业务理解成本低，便于维护

总结

星型模型：维度表不拆分，冗余高、结构简单、查询快，Power BI 首选。
雪花模型：维度表多层拆分，冗余低、关联多、查询慢，不适合 BI 分析。

Power BI 建模关系有什么？

一、四种关系类型

一对多（One to Many）

最常用、最推荐
例：产品表（一）→ 销售表（多）
维度表主键关联事实表外键

多对一（Many to One）

本质和一对多一样，只是方向反过来
销售表（多）→ 产品表（一）

一对一（One to One）

两张表记录一一对应
一般用于拆分宽表，不建议滥用

多对多（Many to Many）

两边都不唯一
性能差、DAX 易出错
尽量用桥接表拆解，不推荐直接使用

两种筛选方向

单向筛选（默认）

维度表 → 事实表
性能稳定、逻辑清晰，推荐使用

双向筛选

两边可以互相筛选
容易造成歧义、性能下降、DAX 计算错误
只在特殊场景（如多表筛选）谨慎开启

总结

Power BI 关系有：一对多、多对一、一对一、多对多。

日常建模优先一对多，用星型模型。
筛选方向默认单向，尽量少用双向和多对多关系。

如何处理多对多关系？

Power BI 支持两种 “多对多”

原生多对多关系（直接建关系，不推荐）
桥接表方案（建模规范，企业项目首选）

原生多对多关系（简单但坑多）

直接在两个表之间建立 多对多关系
优点：快、省事
缺点：
- 性能差
- DAX 计算容易歧义
- 筛选逻辑复杂难排查
- 不适合大数据量

面试必说：不推荐直接使用，只适合临时、简单场景。

标准解决方案：桥接表（Bridge Table）

核心思路

把 多对多 → 拆成两个一对多

表 A ←一对多→ 桥接表 →一对多→ 表 B

做法

提取两个表的关联字段，生成一张唯一关联表例如：学生表 ↔ 课程表 → 生成「学生 - 课程选课表」
用桥接表分别与两张表建立一对多单向关系
原表之间不再直接关联

优点

逻辑清晰
性能好
DAX 稳定不出错
符合星型模型规范

DAX 方案：使用 CROSSFILTER

适合不想改模型的场景：

CALCULATE (
    [度量值],
    CROSSFILTER (表1[列], 表2[列], Both)
)

手动修改关系方向，临时实现多对多筛选。

总结

Power BI 支持原生多对多关系，但性能差、易出错，不推荐。
标准做法是建立桥接表，把多对多拆成两个一对多关系，符合星型模型。
也可以用 DAX 的 CROSSFILTER 临时修改筛选方向。
企业项目优先用桥接表方案。

双向筛选什么时候用？有什么风险？

什么时候用双向筛选

多对多关系场景：两个维度表之间无法直接筛选，需要通过事实表双向打通。
维度表需要互相筛选：比如：筛选「产品类别」要自动过滤「门店」，或反过来。
桥接表（Bridge Table）场景：处理多对多关系时，必须开启双向筛选才能正常联动。

有什么风险（高频考点）

歧义筛选路径（Ambiguous Paths）：筛选有多条路线可走，引擎不知道走哪条，结果不可控。
性能下降：双向筛选会扩大筛选范围、生成更复杂的查询，大模型明显变慢。
逻辑混乱、结果错误：筛选传播超出预期，切片器一选，不该变的数据也跟着变。
容易造成循环依赖：模型关系复杂时，极易出现循环筛选路径。
时间智能函数异常：日期表与事实表双向筛选会导致 YTD、同比等计算出错。

什么是无效关系（虚线关系）？

当模型中出现多条可能的筛选路径，引擎无法确定该用哪条关系进行筛选，这条关系就会被自动设为非活动关系（虚线），不会自动生效。

最常见场景：

一张事实表，对应多个日期字段（订单日期、发货日期、完成日期），都关联日期表
系统只能激活一条日期关系，其他自动变成虚线无效关系

怎么激活使用

必须用 DAX 函数 USERELATIONSHIP 手动指定启用哪条虚线关系。

示例：

发货销售额 = 
CALCULATE(
    [销售额],
    USERELATIONSHIP(订单表[发货日期], 日期表[日期])
)

总结

无效关系就是非活动关系（虚线），因模型存在多条筛选路径导致引擎无法自动使用，必须通过 USERELATIONSHIP 函数手动激活才能生效。

为什么不建议一对多关系把“一”方设为事实表？

因为这违背了星型模型设计规范，会导致筛选逻辑错乱、性能极差、时间智能函数失效。

1. 模型逻辑完全颠倒

标准模型：事实表 = 多端，维度表 = 一端
如果你把事实表设为 “一” 端，相当于：
- 一张订单对应一万个产品
- 一天对应一万条日期完全不符合业务逻辑。

2. 筛选方向完全错误

正常：维度表筛选事实表（选日期 → 过滤订单）
颠倒后：事实表试图筛选维度表切片器、图表筛选会大面积失效或结果错误。

3. 性能急剧下降

事实表数据量通常千万 / 亿级
让大表当 “一端”，引擎做扩展、去重、关系匹配时计算爆炸。

4. 时间智能函数直接不能用

日期表必须是 “一端”、事实表 “多端”，否则 TOTALYTD、SAMEPERIODLASTYEAR 全部计算错误。

5. 关系易歧义、模型不稳定

多表关联时会出现循环路径、 ambiguous paths
报表容易卡顿、报错、结果不可复现。

总结

事实表应该永远是一对多关系中的 “多” 端，维度表是 “一” 端。如果把事实表设为 “一” 端，会导致业务逻辑颠倒、筛选错误、性能极差、时间智能函数失效，完全不符合星型模型规范。

缓慢变化维度 SCD 怎么处理？

SCD（Slowly Changing Dimension）：维度表中的属性会随时间缓慢变化，比如客户所属部门、员工岗位、产品分类、门店区域等。

1. SCD Type 1（直接覆盖）

做法：旧数据直接覆盖，不保留历史
优点：简单、不占空间
缺点：无法追溯历史
适用：不重要、不需要历史记录的字段

2. SCD Type 2（新增行，最常用）

做法：不修改旧数据，新增一行记录，并增加字段：
- 生效开始日期
- 生效结束日期
- 是否当前有效（IsCurrent）
优点：完整保留历史版本
缺点：数据量会变大
适用：需要历史分析、审计、合规场景

3. SCD Type 3（新增列）

做法：加一列存旧值，如：原部门、现部门
优点：简单、能看前后变化
缺点：只能保留少量历史，不适合多次变更

Power BI 中实际怎么处理？

企业里90% 用 Type 2：

给维度表加：StartDate、EndDate、IsCurrent
数据更新时，旧记录标为失效，插入新记录
报表筛选时按日期匹配对应版本

什么是代理键（Surrogate Key）？为什么用？

什么是代理键？

代理键是一张表中没有业务含义、人工创建的唯一标识符，通常是：

自增数字（1,2,3…）
或 GUID
不对应业务字段（如订单号、身份证号、商品编码）

与之相对的是业务键（自然键），比如：用户 ID、订单号、商品编码。

为什么要用代理键？

1. 稳定性更强

业务键可能会变（如商品编码升级、企业统一社会信用代码变更），代理键永远不变，避免关系断裂。

2. 提升关联性能

数字类型比字符串、复合键更小、更快，Power BI 建模和查询性能更好。

3. 避免复合主键

业务中经常需要多字段联合唯一，用代理键可以简化成单字段关联，模型更清爽。

4. 兼容缓慢变化维（SCD）

维度表记录发生变化（如用户改名、部门调整）时，代理键能保留历史版本，适合数据仓库。

总结

代理键：无业务含义、人工生成的唯一主键，一般为自增数字。
作用：关系更稳定、性能更好、简化模型、支持历史维度管理。

如何在PowerBI中创建代理键？

在 Power BI 中创建代理键，优先用 Power Query 加索引列（最稳、最快、最推荐），其次是 DAX 计算列（适合按特定规则排序）。下面给你可直接照做的步骤与代码。

方法 1：Power Query 索引列（推荐 ✅）

1. 操作步骤（可视化）

打开 Power BI Desktop → 选中表 → 点击「转换数据」进入 Power Query 编辑器。
左侧「查询」面板选中要加代理键的维度表（如 Dim_Product、Dim_Customer）。
顶部「添加列」→「索引列」→ 选「从 1 开始」（建模常用，避免 0 歧义）。
重命名列（如 ProductKey、CustomerKey）→ 确认数据类型为「整数」。
点击「关闭并应用」，加载到模型。

2. 对应 M 代码（可直接复制）

// 给当前表添加从1开始的索引列，命名为 代理键
= Table.AddIndexColumn(上一步, "代理键", 1, 1, Int64.Type)

3. 优点

自动随数据刷新更新，性能最好。
无重复、无空值，天然适合做主键。
适合所有维度表，尤其缓慢变化维（SCD）。

方法 2：DAX 计算列（按业务规则排序）

适合需要按特定字段排序生成序号的场景（如按日期、按名称）。

1. 公式（按某列排序生成唯一序号）

代理键 = 
RANKX(
    ALL('表名'),
    '表名'[排序依据列],
    ,
    ASC,  // 升序
    DENSE // 密集排名（无跳号，保证连续）
)

2. 示例（按产品名称排序）

ProductKey = 
RANKX(
    ALL(Dim_Product),
    Dim_Product[ProductName],
    ,
    ASC,
    DENSE
)

3. 注意

必须有唯一排序依据，否则可能重复。
大数据量下性能不如 Power Query 索引。

方法 3：合并业务键生成（复合键场景）

当业务键是多列组合（如 品牌+型号），先合并成单列，再生成代理键。

1. Power Query 步骤

选中多列（如 Brand + Model）→「添加列」→「合并列」。
分隔符用无意义字符（如 |）→ 命名为 NaturalKey。
再添加「索引列」作为最终 代理键。

2. M 代码

// 1. 合并业务键
= Table.CombineColumns(源, {"Brand", "Model"}, Combiner.CombineTextByDelimiter("|", QuoteStyle.None), "NaturalKey")
// 2. 添加代理键
= Table.AddIndexColumn(上一步, "ProductKey", 1, 1, Int64.Type)

建模最佳实践（面试 / 项目必用）

只给维度表加代理键，事实表用对应外键关联。
代理键命名规范：表名Key（如 CustomerKey、DateKey）。
模型中：维度表代理键 = 主键，事实表同名列 = 外键，建立一对多单向关系。
日期表建议用 DateKey（整数，如 20260331），既稳定又兼容时间智能。

总结

常规场景：Power Query 索引列（从 1 开始） → 最稳最快。
需排序：DAX RANKX(DENSE) → 按业务规则生成。
复合键：先合并业务键，再加索引 → 解决多列唯一问题。

如何实现动态行列转换？

在 Power BI 里实现动态行列转换（也叫动态透视、动态矩阵），核心思路只有一套：用度量值 + 切片器控制显示的字段，实现用户切换维度时，矩阵行列自动变化。

1. 标准做法：动态行 / 动态列（最常用）

步骤

1. 建一个参数表（维度选择表）手动建表，写入你要切换的维度名称，例如：

产品类别
区域
年月
客户等级

2. 写一个「动态行维度」度量值

动态行 =
SWITCH(
    SELECTEDVALUE('参数表'[选择]),
    "产品类别", SELECTEDVALUE('产品'[类别]),
    "区域",     SELECTEDVALUE('区域'[名称]),
    "年月",     SELECTEDVALUE('日期'[年月]),
    "客户等级", SELECTEDVALUE('客户'[等级])
)

3. 把这个度量值放入矩阵的 “行”

切片器选择不同维度 → 矩阵行自动变化。

4. 同理做「动态列」度量值

动态列 =
SWITCH(
    SELECTEDVALUE('参数表'[列选择]),
    "渠道", SELECTEDVALUE('渠道'[类型]),
    "支付方式", SELECTEDVALUE('订单'[支付方式])
)

5. 值放你的指标（销售额、数量等）

效果：切片器切换 → 矩阵行列自动变，实现动态行列转换。

2. 进阶做法：动态字段（字段参数 Field Parameters）

Power BI 内置功能，最简单、最稳定。

建模 → 新建参数 → 字段参数
勾选你要动态切换的字段（产品、区域、日期、客户等）
把生成的参数字段直接拖进矩阵的行 / 列
自动出现切片器，切换即可动态变行列

优点：

不用写 DAX
性能最好
支持多级层次
官方推荐

总结

动态行列转换就是用字段参数或 SWITCH+SELECTEDVALUE 动态度量值，让用户通过切片器切换矩阵的行、列维度，实现灵活的动态透视表。

Power Query常用操作？

Power Query 主要负责数据获取、清洗、转换（ETL）

数据导入：连接各种数据源：Excel、CSV、SQL、MySQL、Web、文件夹等。

行列处理：删除无用行列、提升首行作为标题、移动行列、重命名列。

数据类型修改：将文本改为数字、日期、布尔值，避免建模报错。

删除重复值 & 处理空值：去重；空值填充上一行 / 下一行、替换为 0 或平均值。

拆分列 & 合并列：按分隔符 / 位置拆分；多列合并成一列。

透视 & 逆透视：宽表转长表、长表转宽表，适配建模。

追加查询（纵向合并）：多个结构相同的表上下拼接（如多个月份 Excel）。

合并查询（横向关联）：类似 SQL 的 Join，按关键字段左联、内联等。

添加条件列 / 自定义列：用 IF 逻辑做分组、打标签；写 M 语言实现复杂计算。

分组聚合：按字段分组求和、计数、平均值。

什么是查询折叠（Query Folding）？

查询折叠是 Power Query 的一项核心优化能力，指：Power Query 会自动把你做的清洗、转换步骤，翻译成数据源的原生查询语句（如 SQL），在数据源服务器端直接执行，而不是把所有数据加载到本地再处理。

简单说：让数据在源头处理完，只把结果传回 Power BI，而不是把全量数据拉回来再算。

核心作用

大幅提升性能：减少数据传输量，速度快很多。

减轻本地压力：不用加载全量数据到内存。

支持增量刷新：必须开启查询折叠，才能用增量刷新。

大数据量必备：百万 / 亿级数据清洗，必须依赖查询折叠。

怎么判断是否生效？

在 Power Query 中：

右键步骤 → 看 View Native Query（查看原生查询）
如果可点击、能看到 SQL → 折叠生效 ✅
如果灰色不可点 → 未生效 ❌

哪些操作支持 / 不支持？

✅ 支持：筛选、排序、删列、合并、追加、分组、替换
❌ 不支持：添加索引列、添加自定义 M 列、透视、部分复杂转换

总结

查询折叠是 Power Query 的优化机制，将数据转换步骤翻译成数据源的原生查询，在源头执行，只返回结果。优点是性能快、省流量、支持增量刷新，是大数据处理的关键。

如何处理缺失值/空值？

Power Query 中处理（源头清洗，推荐）

1. 删除空行 / 空列

直接删掉全为空或无用的行、列。

2. 填充空值

向上填充（Fill Up）
向下填充（Fill Down）常用于日期、类别字段连续空缺。

3. 替换空值

数值列空值 → 替换为 0
文本列空值 → 替换为 “未知”“其他”

4. 根据条件替换

使用 替换值、条件列，按业务逻辑给默认值。

DAX 中处理（报表层面，不改动源数据）

ISBLANK 判断是否为空

处理后销量 = IF(ISBLANK([销量]), 0, [销量])

COALESCE 空值替换（简洁写法）

处理后销量 = COALESCE([销量], 0)

DIVIDE 安全除法

避免分母为空导致报错，自动返回空或 0。

计算列 / 度量值兜底

对筛选后无数据的情况返回 0 或提示文本。

总结

处理空值分两种方式：

Power Query：删除空行空列、上下填充、替换为 0 或指定文本。
DAX：用 ISBLANK、COALESCE 判断并替换为空或 0，用 DIVIDE 避免除零错误。

如何实现同环比为空白时不显示错误？

先判断分母是否为空 → 再用 IFERROR / IF + ISBLANK 包裹，返回空白不报错。

方法 1：IFERROR（最简单）

环比增长率 =
IFERROR(
    DIVIDE([本期] - [上期], [上期]),
    BLANK()
)

出现错误（除以 0、无数据）直接返回空白
不显示 Infinity、NaN、0

方法 2：IF + ISBLANK（更严谨，推荐）

环比增长率 =
VAR 本期值 = [本期]
VAR 上期值 = [上期]
RETURN
IF(
    ISBLANK(上期值) || 上期值 = 0,
    BLANK(),
    DIVIDE(本期值 - 上期值, 上期值)
)

只有上期有值且不为 0 时才计算
否则直接空白，不显示错误

同比版本（完全一样逻辑）

同比增长率 =
IF(
    ISBLANK([去年同期]) || [去年同期] = 0,
    BLANK(),
    DIVIDE([本期] - [去年同期], [去年同期])
)

总结

用 IF + ISBLANK 判断上期 / 去年同期是否为空，为空返回 BLANK ()，否则再计算同环比，避免除以零或无数据导致的错误显示。

追加查询（Append）与合并查询（Merge）区别？

Append：行拼接（上下叠加）
Merge：列拼接（左右关联，类似 SQL JOIN）

Append（追加）

作用：把结构相同的多个表，按行上下拼在一起
效果：行数变多，列数不变
场景：多个月份 Excel、多个地区相同表、分表合并
类比：把两摞相同格式的纸叠在一起

Merge（合并）

作用：根据关联字段把多个表按列左右拼在一起
效果：列数变多，行数可不变
场景：订单表 + 客户表、事实表 + 维度表
类比：根据学号把学生表和成绩表拼在一起

总结

Append 是行追加，上下叠表；Merge 是列合并，按关键字段左右关联（JOIN）。

什么是自定义函数？

自定义函数就是把一段重复使用的 Power Query 步骤封装起来，取个名字，以后可以重复调用，避免重复写代码。

核心特点

可复用：同样的数据处理逻辑（导入文件、清洗格式、计算逻辑），只写一次，到处调用。
带参数：可以传入参数（如文件名、日期、路径），灵活处理不同数据。
简化代码：让查询结构更清晰，维护更方便。

典型使用场景

批量导入多个格式相同的 Excel/CSV
统一清洗列名、格式、数据类型
批量处理文件夹内所有文件
重复使用的复杂计算逻辑

总结

自定义函数是将重复的 Power Query 逻辑封装成可调用的函数，传入参数即可重复使用，用于简化代码、批量处理数据。

如何导入文件夹下所有 Excel？

获取数据 → 从文件夹
选择文件夹路径 → 确定
点击 “合并并加载至” → 合并并编辑
在弹出窗口中，选择要加载的 Sheet（通常选 Sheet1）
加载后 PQ 会自动合并所有 Excel 为一张表
检查并修正列名、数据类型 → 关闭并应用

如何处理合并后的重复列名？

合并前重命名：在合并前先给各表前缀 / 后缀，避免重名
使用 Table.PrefixColumns 批量加前缀
删除多余重复列：只保留主表字段
合并后手动重命名冲突列

报表/模型慢的优化思路？

减少数据量、简化计算、优化引擎、规范建模。

1. 数据层优化（最有效）

只加载需要的列和行删除无用列、用筛选条件减少行，避免全量导入。
使用查询折叠让数据在源头处理，减少传输与计算。
使用 Import 模式大数据量尽量用导入模式，DirectQuery 容易慢。
使用增量刷新只刷新最新数据，历史数据不动，大幅提速。

2. 建模层优化

使用星型模型避免雪花模型、减少多对多关系。
减少计算列能在 Power Query 做的不在 DAX 做，计算列会膨胀模型。
避免重复数据删除重复行、合并冗余表。
使用整数代理键数字关联比字符串快很多。

3. DAX 计算优化

多用度量值，少用计算列度量值按需计算，不占存储空间。
避免复杂迭代嵌套少用嵌套 FILTER、SUMX，改用 CALCULATE 简化。
使用变量（VAR）避免重复计算，提升可读性与速度。
关闭不必要的总计行总计会额外计算，慢的报表可以关掉。

4. 可视化层优化

减少页面视觉对象数量一个页面不要放太多图表。
避免使用复杂自定义视觉对象第三方视觉对象性能差。
减少使用高亮、交互、钻取动画交互多会触发多次 DAX 计算。
关闭自动日期 / 时间智能避免自动生成隐藏日期表造成冗余。

5. 服务与存储优化

使用 Power BI Premium/Embedded 提升算力
清理模型元数据、刷新数据集
避免过大图片、过多书签

增量刷新（Incremental Refresh）配置步骤？

增量刷新核心是只刷新新增 / 变更数据、保留历史分区，大幅提升大数据集刷新速度，必须依赖查询折叠。

一、前提条件（必满足）

事实表必须有日期 / 时间列（如 OrderDate、CreateTime），且类型为 Date/Time。
数据源支持查询折叠（SQL、Snowflake、Databricks 等，CSV/Excel 本地文件不支持）。
发布到 Power BI 服务（Pro/Premium 均可，实时数据需 Premium）。

二、详细配置步骤（6 步）

1. 进入 Power Query 编辑器

Power BI Desktop → 主页 → 转换数据（Transform Data）。

2. 创建两个保留参数（区分大小写）

主页 → 管理参数（Manage Parameters） → 新建参数。

参数 1

名称：RangeStart
类型：Date/Time
当前值：设为近 1 个月 / 1 周的小范围日期（如 2026-01-01），避免 Desktop 加载全量数据。

参数 2

名称：RangeEnd
类型：Date/Time
当前值：DateTime.LocalNow ()（今天）。

点击确定。

3. 用参数筛选日期列（关键）

选中日期列 → 右键 → 筛选器 → 自定义筛选器。条件：日期列 >= RangeStart 且日期列 < RangeEnd（必须用 < 避免重复）。

点击确定 → 关闭并应用（Close & Apply）。✅ 验证：右键步骤 → 查看原生查询（View Native Query）可点，说明查询折叠生效。

4. 配置增量刷新策略

回到报表视图 → 右侧数据面板 → 右键目标表 → 增量刷新（Incremental Refresh）。开启增量刷新开关。

配置核心策略（示例）：

存储过去：5 年（保留 5 年历史数据）。
刷新最近：10 天（每次只刷新最近 10 天数据）。
检测数据更改（Detect Data Changes）：勾选（按日期 / 更新时间识别变更，推荐）。
仅刷新完整周期：按需勾选。

点击应用。

5. 保存并发布到 Power BI 服务

保存 .pbix → 发布到目标工作区（Pro/Premium）。⚠️ 重要：发布后不能从 Desktop 重新发布，会清空分区与历史数据；后续改结构用 ALM Toolkit 或 TMSL。

6. 服务端执行首次刷新

进入 Power BI 服务 → 数据集 → 立即刷新。首次刷新会加载全部历史数据（按 “存储过去” 设置）；后续刷新仅处理 “刷新最近” 窗口内数据。

总结

准备：事实表有日期列、查询折叠生效。
建参数：RangeStart、RangeEnd（Date/Time）。
筛选：日期 >= RangeStart 且 < RangeEnd。
设策略：开启增量刷新，配置存储周期与刷新窗口。
发布到服务，执行首次全量刷新，后续增量刷新。

常见坑

❌ 日期列类型不是 Date/Time → 无法配置。
❌ 查询折叠失效 → 增量刷新不生效，仍全量拉取。
❌ 用 <= RangeEnd → 数据重复。
❌ 发布后重新从 Desktop 发布 → 丢失历史分区。

聚合（Aggregations）是什么？

聚合（Aggregations）有两层核心含义：基础聚合（计算）与性能聚合（缓存）。前者是数据汇总的计算逻辑，后者是解决大数据 / DirectQuery 性能瓶颈的高级建模技术。

基础聚合（Aggregation）：数据汇总计算

定义：对多行数据按维度分组，执行求和、平均、计数、最大 / 最小等统计运算，得到汇总值。场景：做报表时，数值列默认自动聚合（如 Sum of 销售额）。常见函数：SUM/AVERAGE/COUNT/MAX/MIN/DISTINCTCOUNT/COUNTROWS。示例：按 “日期 + 产品” 分组，计算 SUM (销售额)、COUNT (订单 ID)。

性能聚合（Aggregations）：高级性能优化（面试 / 实操重点）

定义：在模型中预建聚合表（Aggregation Table），将明细数据按常用维度预汇总并缓存到内存；查询时优先命中聚合表，避免扫描全量明细，大幅提速（尤其 DirectQuery / 超大数据集）。

核心原理

明细表（Detail Table）：原始大表（如订单事实表，亿级行）。
聚合表（Agg Table）：按高频维度（如日期、区域、产品）预汇总的小表（千 / 万行）。
查询重定向：DAX 引擎自动判断：
- 若查询维度 / 指标在聚合表覆盖范围内 → 读聚合表（内存，毫秒级）。
- 若不覆盖 → fallback 到明细表（DirectQuery / 全量扫描）。

核心价值（解决什么问题）

DirectQuery 提速：避免每次查询都发 SQL 到源库，减少往返与计算压力。
大数据模型提速：亿级明细→万级聚合，内存占用与查询时间指数级下降。
保留钻取能力：聚合表不丢明细，可下钻到原始数据。

聚合表配置要点（面试必背）

创建聚合表：在 Power Query 按维度分组，预计算 SUM/COUNT 等指标。
关联关系：聚合表与明细表、维度表建立正确关系（通常多对一）。
管理聚合（Manage Aggregations）：
- 右键聚合表 → 管理聚合。
- 为每列指定：聚合类型（Sum/Count 等）、关联明细表、关联明细列。
自动聚合（Automatic Aggregations）：Premium/Power BI Fabric 可自动训练生成聚合表，无需手动建表。

维度	基础聚合（Aggregation）	性能聚合（Aggregations）
核心目标	计算汇总值，做报表	性能优化，减少明细扫描
实现方式	DAX 函数 / 可视化自动汇总	预建聚合表 + 查询重定向
适用场景	所有报表、度量值	DirectQuery / 亿级明细 / 报表慢
内存 / 性能	实时计算，大数据慢	预缓存，查询极快
是否丢失明细	不丢失（可下钻）	不丢失（fallback 到明细）

总结

基础聚合：对数据分组做统计计算（如 SUM/AVG），是报表的基础。

性能聚合：预建汇总表缓存到内存，让大模型 / DirectQuery 报表秒级响应，是 Power BI 高级性能优化的核心手段。

行级别安全（RLS）实现？

RLS = Row Level Security，用于控制不同用户只能看到自己权限内的数据。

核心原理

在 Power BI 数据集里创建角色（Role）
给角色设置 DAX 过滤规则
发布到服务后，把用户分配到对应角色
用户查看报表时，引擎自动按规则过滤行

实现步骤

1. 创建角色

Power BI Desktop → 建模选项卡 → 管理角色 → 创建 → 输入角色名。

2. 配置行级过滤 DAX

选中要限制的表，输入筛选表达式：

[部门列] = USERPRINCIPALNAME()

或

[区域] = "华东"

3. 测试角色

建模 → 查看为角色 → 选择角色 → 查看数据是否被正确过滤。

4. 发布到服务

发布 PBIX 文件 → 进入数据集 → 数据权限 → 添加用户并分配角色。

最常用 3 个 RLS 函数

USERPRINCIPALNAME()：获取当前登录邮箱，用于按邮箱 / 账号权限过滤。

USERNAME()：获取域账号（很少用）。

LOOKUPVALUE()：从权限表动态匹配权限（高级动态 RLS）。

动态权限示例（最常用）

[销售区域] = 
LOOKUPVALUE(
    权限表[允许区域],
    权限表[邮箱], USERPRINCIPALNAME()
)

作用：用户登录 → 自动匹配权限表 → 只看自己区域数据。

总结

在 Desktop 用管理角色创建角色。
用 USERPRINCIPALNAME() 或 LOOKUPVALUE() 写过滤规则。
用查看为角色测试权限。
发布到服务，给用户分配角色。
实现不同用户看不同数据。

如何让用户只能看自己部门数据？

创建角色 + 用 USERPRINCIPALNAME 匹配部门权限

实现步骤

1. 准备一张权限表

包含字段：邮箱、部门（用户邮箱对应所属部门）。

2. 在 Power BI Desktop 建立 RLS 角色

建模 → 管理角色 → 新建角色（如：Role_Sales）
选择要过滤的事实表 / 部门表
写入 DAX 过滤规则：

[部门] = LOOKUPVALUE(
    权限表[部门],
    权限表[邮箱], USERPRINCIPALNAME()
)

3. 测试角色

建模 → 查看为角色 → 选择角色 → 验证是否只看到对应部门数据。

4. 发布到服务

发布后进入数据集 → 数据权限 → 添加用户并分配角色。

简单版（部门 = 邮箱后缀 / 固定匹配）

如果部门直接和账号关联，可直接写：

[部门] = "销售一部"

或按邮箱判断：

LEFT(USERPRINCIPALNAME(), 3) = "sal"

总结

建立用户 - 部门权限映射表，通过 RLS 角色使用 LOOKUPVALUE + USERPRINCIPALNAME 动态匹配当前用户部门，实现只看本部门数据。

Power BI 复合模型？

复合模型 = 同一模型内混合使用 Import、DirectQuery、Dual 三种存储模式，或跨多个 DirectQuery 数据源，解决 “性能 vs 实时性” 的矛盾，是企业级建模的核心技术。

核心定义与价值

1. 定义

在一个 Power BI 语义模型中，允许：

部分表用 Import（导入内存）
部分表用 DirectQuery（实时查源）
部分表用 Dual（双模式，自动切换）
或同时连接 多个 DirectQuery 数据源（如 SQL Server + Snowflake）

2. 解决的痛点

传统模型只能单一模式：Import 快但不实时，DirectQuery 实时但慢
复合模型：高频维度 / 历史数据用 Import 提速，实时交易 / 大事实表用 DirectQuery 保新鲜
支持复用已有 Power BI 数据集 / AS 模型，避免重复建模

模式	特点	适用场景	典型表类型
Import	数据导入内存，查询极快；需刷新	维度表、历史汇总、小表	产品、区域、日期维度
DirectQuery	不导入，实时查源；延迟高、压力大	大事实表、实时数据、频繁更新	订单、交易、日志
Dual	同时存内存 + 实时；自动选最优	与 DirectQuery 事实关联的维度	共用维度（如日期、客户）

复合模型的三种典型类型

Import + DirectQuery 混合（最常用）

维度表 Import，事实表 DirectQuery
兼顾维度筛选速度与事实实时性

多 DirectQuery 数据源

同时连 SQL Server、Oracle、Snowflake 等
跨库分析，无需 ETL 整合

基于 Power BI 数据集 / AS 的复合模型

DirectQuery 连已有数据集，再添加本地 Import 表
复用企业级模型，快速扩展报表Microsoft Power BI

实现步骤

1. 启用复合模型（默认开启）

Power BI Desktop → 文件 → 选项和设置 → 选项 → 预览功能 → 确保 “复合模型” 已启用（新版默认开启）

2. 连接数据源并设置存储模式

连接 Import 数据源（如 Excel、CSV）→ 加载为 Import
连接 DirectQuery 数据源（如 SQL Server）→ 选择 “DirectQuery”
对维度表 → 右键 → 属性 → 存储模式 → 设为 Dual（推荐）

3. 建立关系（关键）

遵循星型模型：维度表（Import/Dual）→ 事实表（DirectQuery）
跨源关系为有限关系（Limited Relationship），性能与功能受限

4. 编写 DAX 与度量值

优先在 DirectQuery 事实表上建度量值
避免跨源复杂计算（如跨 Import/DirectQuery 的复杂聚合）

5. 发布与权限

发布到服务后，DirectQuery 需配置数据源凭据
RLS 需在源模型与复合模型分别配置，权限叠加生效

核心规则与限制

计算表 / 列：只能基于 Import/Dual 表，不能基于 DirectQuery 表
跨源关系：为有限关系，不支持双向筛选、某些 DAX 函数（如 PATH）
Dual 表：必须与 DirectQuery 事实同数据源，否则自动转为 Import
性能：避免大量跨源查询；优先用 Dual 维度 + DirectQuery 事实组合
刷新：仅 Import/Dual 表需刷新；DirectQuery 实时取数

最佳实践

维度表：常用维度设为 Dual，兼顾速度与实时关联
事实表：大 / 实时事实用 DirectQuery；历史汇总用 Import
模型复用：用 DirectQuery 连企业级数据集，再扩展本地报表Microsoft Power BI
性能监控：用性能分析器查看查询是走内存还是源库

总结

复合模型允许在同一模型中混合 Import、DirectQuery、Dual 存储模式，或连接多个 DirectQuery 数据源，平衡查询性能与数据实时性，是 Power BI 企业级建模的必备能力。

复合模型和单一模式的区别？

单一模式（Single Mode）

整个模型只能选一种存储方式：

要么全表 Import（导入模式）
要么全表 DirectQuery（直连模式）

不能一部分导入、一部分直连。

复合模型（Composite Model）

同一个模型里可以混用多种存储模式：

部分表 Import
部分表 DirectQuery
部分表 Dual（双重模式）
还可以连接多个 DirectQuery 数据源

核心区别对比

灵活性

单一模式：死板，全局统一
复合模型：灵活，可按表单独设置

性能与实时性

单一 Import：快，但数据不实时
单一 DirectQuery：实时，但整体慢
复合模型：维度表 Import 提速，大事实表 DirectQuery 保实时

数据源支持

单一模式：一般只连一个数据源
复合模型：支持多数据源直连，跨库分析

适用场景

单一模式：小数据、简单报表、标准 dashboard
复合模型：企业级大数据、实时报表、多系统整合

总结

单一模式：全模型统一 Import 或 DirectQuery，简单但不够灵活。
复合模型：混合 Import + DirectQuery + Dual，兼顾速度与实时性，适合复杂企业场景。

多个报表共用一个模型怎么做？

在 Power BI 中，多个报表共用一个模型的标准方案是：先做一个 “主模型” 发布到服务，再用 “实时连接 / 共享数据集” 让所有报表都连它。下面是完整做法、优缺点与最佳实践。

核心方案：共享数据集（推荐）

1. 整体流程

1. 制作主模型（Master Dataset）

在 Power BI Desktop 建好统一模型：数据源、Power Query、表关系、所有度量值 / 计算列。
发布到 Power BI 服务（Workspace），成为共享数据集（语义模型）。

2. 所有报表都连这个共享数据集

新建报表 → 获取数据 → Power BI 数据集 → 选择主模型 → 实时连接（Live Connection）。
每个报表是独立 .pbix，但只读使用主模型的表、度量值、关系。

3. 统一维护

只在主模型里改数据、刷新、加度量值；所有报表自动同步更新。

2. 详细操作步骤

（1）发布主模型

打开主模型 .pbix → 发布 → 选目标工作区 → 发布成功。
服务中找到该数据集 → 管理权限 → 给团队成员生成 / 构建权限。

（2）新建报表并连接共享数据集

打开 Power BI Desktop → 新建空白报表。
主页 → 获取数据 → Power BI 数据集。
登录账号 → 找到工作区 → 选中主模型 → 连接。
进入实时连接模式：只能用现有字段 / 度量值，不能本地建模 / 改模型。
做报表页面 → 保存为独立 .pbix → 发布到服务。

3. 优点

单一数据源：数据口径统一、无重复计算、刷新一次全报表生效。
维护成本低：改度量值 / 加字段只在主模型做一次。
权限集中：在数据集层面控制谁能看、谁能构建报表。
性能更好：复用缓存、减少重复查询。

4. 限制

实时连接模式下：不能本地添加表、改关系、写新计算列 / 度量值。
所有报表必须联网访问服务数据集，不能离线使用。
主模型刷新后，报表需重新打开 / 刷新才看到新数据。

其他方案（按需选择）

方案 2：模板文件（.pbit）

做法：主模型另存为 .pbit 模板 → 团队用模板新建报表 → 自动继承模型。
适合：项目初期、模型不常改、需要本地可编辑的场景。
缺点：模板更新后，旧报表不会自动同步，需手动合并。

方案 3：复合模型（Composite Model）

做法：连接共享数据集 + 本地导入少量补充表 / 度量值。
适合：需要在共享模型基础上加本地个性化计算 / 小表的场景。
注意：会打破实时连接，性能与刷新逻辑变复杂。

方案 4：Power BI Report Server（本地部署）

做法：主模型发布到 Report Server → 报表通过服务器连接共用模型。
适合：内网、无云环境、需本地管控的场景。

最佳实践（避坑）

主模型专人维护：设数据集所有者，统一管理变更与权限。

命名规范：数据集、度量值、表 / 列命名统一，方便团队使用。

权限分级：

数据集：所有者（编辑）、成员（构建报表）、查看者（只读）。
报表：按工作区 / 应用控制访问。

刷新策略：主模型按业务需求定时刷新；报表无需单独刷新。

版本管理：主模型迭代用版本号，重大变更前通知团队。

监控：用 Power BI 服务的数据集性能、使用情况监控慢查询与访问量。

方案	模型修改	数据同步	适用场景	复杂度
共享数据集（实时连接）	仅主模型可改	自动同步	团队协作、统一口径、长期维护	低
模板文件（.pbit）	各报表可本地改	手动同步	项目初期、模型稳定	中
复合模型	共享 + 本地混合	部分自动	需个性化补充数据	高
Report Server	仅主模型可改	自动同步	内网、本地部署	中高

总结

优先用「共享数据集 + 实时连接」：做一个主模型发布到服务，所有报表都连它，统一维护、自动同步、成本最低。

Power BI 分页报表（Paginated Reports）？

分页报表 = 固定布局、像素级精准、专为打印 / PDF / 长列表设计的报表格式（.rdl），核心是完整输出所有数据、严格分页、高度格式化，与交互式 Power BI 报表定位完全不同

核心定义与本质

文件格式：.rdl（Report Definition Language），与 SSRS 同源。
设计工具：Power BI Report Builder（独立免费工具，非 Desktop）。
核心定位：打印 / 导出优先、长列表完整展示、合规文档，而非交互探索。
关键能力：自动分页、精确控制每页行数、完整导出所有行、页眉页脚 / 页码 / 水印。

核心特性

像素级布局（Pixel-Perfect）

精确控制每个元素位置、大小、字体、边框、对齐。
支持页眉 / 页脚、重复表头 / 表尾、页码、水印、页码表达式。

完整数据输出

表格无论多少行，自动分页、全部导出 / 打印（标准报表仅导出可见行）。
支持固定行数分页（如每页 30 行）。

参数化与钻取

强参数支持（下拉、单选、多选、日期），动态筛选数据。
支持文档结构图、钻取、子报表。

数据源与模型

无内置数据模型，直接连数据源（SQL、Oracle、Power BI 数据集、AAS 等）。
支持多数据源、嵌入式数据集。

导出与分发

完美导出：PDF、Excel、Word、PPT、CSV。
支持 Power BI 服务订阅、自动邮件发送 PDF。

维度	分页报表（Paginated）	标准 Power BI 报表（Interactive）
设计目标	打印 / PDF / 合规文档、完整长列表	交互探索、可视化分析、仪表板
布局	固定页面、像素级精准、强制分页	流式布局、自适应、无固定分页
数据展示	输出所有行，自动分页	仅展示可见行，滚动查看
交互性	弱（参数、钻取）	强（切片器、筛选、下钻、交叉筛选）
可视化	表格、矩阵、基础图表	丰富图表、自定义视觉对象、地图
创作工具	Report Builder（.rdl）	Power BI Desktop（.pbix）
许可要求	Power BI Premium / PPU	Pro 即可
适用场景	财务报表、发票、清单、监管报告	销售看板、运营分析、自助分析

适用场景

财务 / 合规：损益表、资产负债表、审计报告、监管报送。
长列表输出：销售明细、库存清单、客户台账（万行 +）。
打印 / 纸质：需要纸质存档、盖章、邮寄的报表。
精准格式：发票、合同、证书、固定模板文档。
批量分发：按参数批量生成并邮件发送 PDF。

实现流程

1. 安装工具：下载安装 Power BI Report Builder（免费）。

2. 连接数据源：创建数据源（SQL、Power BI 数据集等）→ 定义数据集（SQL/DAX）。

3. 设计报表：

插入表格 / 矩阵 → 绑定字段 → 设置分页属性（固定行数、分页符）。
设计页眉 / 页脚、页码、水印、样式。
添加参数、钻取、子报表。

4. 预览与导出：本地预览 → 导出 PDF/Excel 验证。

5. 发布与部署：保存为.rdl → 上传至Premium/PPU 工作区 → 配置权限与订阅。

关键限制

无内置模型：不能像.pbix 那样建关系、计算列 / 表，依赖源数据或参数。
交互弱：无切片器、交叉筛选，仅支持参数与钻取。
许可门槛：必须 Power BI Premium 或 PPU，Pro 无法使用。
可视化有限：仅基础图表，无自定义视觉对象。
性能：大数据量需优化查询，避免全表扫描。

总结

分页报表是 Power BI 中专为打印、PDF、长列表、合规文档设计的固定格式报表，用 Report Builder 创作，需 Premium 许可，核心价值是完整输出、精准排版、完美导出。

X 轴不连续、日期断层怎么解决？

根本原因：数据源里没有每天的数据，直接用事实表日期做坐标轴就会出现断档。

解决步骤

新建一张独立、完整的日期表包含连续的每一天，不能有缺失。
把日期表标记为日期表建模 → 标记为日期表 → 标记为日期表。
建立关系日期表 [日期] ↔ 事实表 [日期]，一对多关系。
坐标轴改用「日期表」的日期字段不要用事实表里的日期。
可选：在 X 轴设置里打开“显示无数据的项目”

为什么必须建日期表？

1. 解决日期断层问题

事实表缺少某些日期时，X 轴会出现空白间断；用连续日期表可保证日期完整。

2. 才能正常使用时间智能函数

TOTALYTD、SAMEPERIODLASTYEAR、DATEADD 等 DAX 时间智能函数，必须依赖标记为日期表的连续日期表，否则计算错误或报错。

3. 统一时间维度口径

年、季度、月、周、工作日、财务月等统一维护，避免多张表时间逻辑不一致。

4. 支持按标准时间维度筛选和分组

如按年月汇总、按财年统计、按工作日 / 周末分析等。

5. 避免性能问题

直接用事实表日期做轴和筛选，会导致重复值多、筛选慢、模型关系复杂。

Power BI 钻取（Drillthrough）与 Drill Down 实现？

核心概念区分

1. Drillthrough（跨页钻取 / 穿透）

定义：从汇总页右键点击数据点，跳转到另一详情页，并自动传递筛选上下文（如选中 “产品 A”，详情页只显示 A 的数据）。
核心：页面跳转 + 上下文传递，用于看明细 / 深度分析。

2. Drill Down/Up（层级钻取 / 下钻 / 上卷）

定义：在同一页面的层级字段（如年→季→月→日）中展开 / 收起，看更细 / 更粗粒度数据。
核心：同页层级切换，不跳转页面。

Drillthrough（跨页钻取）完整设置（标准步骤）

1. 准备工作（必做）

确保数据模型关系正确（维度表↔事实表，一对多）。
准备源页（汇总图表，含钻取维度，如产品、客户）和目标页（详情页）。

2. 配置目标详情页（关键）

新建 / 选中详情页（如 “产品详情”）。
右侧「可视化」→ 展开「钻取」（Drillthrough）区域。
从「数据」窗格，拖入钻取字段（如产品名称、客户ID）到「钻取筛选器」框M。
自动生成返回按钮（Back），可自定义样式。
在详情页添加明细视觉（表格、卡片、折线图等），展示选中项的详细数据。

3. 触发钻取（两种方式）

方式 1：右键点击（原生）

源页图表（如柱状图）→ 右键点击数据点（如 “产品 A”）→ 选择「钻取→产品详情」→ 自动跳转并筛选。

方式 2：按钮触发（更友好）

源页 → 「插入」→「按钮」→ 选「钻取」按钮。
按钮格式 →「操作」→「钻取」→ 选择目标页（如 “产品详情”）。
点击按钮，自动按当前筛选上下文跳转。

4. 高级设置

多字段钻取：钻取区域拖入多个字段（如产品+地区），跳转时同时传递多个筛选。
保留所有筛选器（Keep all filters）：钻取设置中开启，保留源页所有切片器 / 筛选，仅叠加钻取字段。
跨报表钻取：Power BI Service 中，目标页来自其他报表，需配置「跨报表钻取」权限。

Drill Down/Up（层级钻取）设置（同页下钻）

1. 准备层级字段

方式 1：直接拖入多层字段（如年→季→月→日）到图表轴 / 图例。
方式 2：模型层创建层次结构（右键字段→「创建层次结构」→ 添加下级字段）。

2. 启用钻取

选中图表 → 右侧「格式」→「视觉对象」→ 开启「钻取」（Drill）。
图表右上角出现钻取图标（↓展开、↑收起、↕切换层级）。

3. 操作方式

下钻（Drill Down）：点击数据点 +↓，展开下级（如年→季）。
上卷（Drill Up）：点击↑，返回上级（如月→季→年）。
展开层次结构（Expand all）：一次性展开所有层级。

总结

Drillthrough：建详情页→拖入钻取字段→右键 / 按钮跳转，跨页传筛选看明细。
Drill Down：建层级字段→开启钻取→用图标切换，同页看粗细粒度。

常见问题与排查

钻取菜单不显示→ 源页图表必须包含钻取字段；目标页钻取字段已正确配置。
详情页无数据→ 检查模型关系；确认详情页视觉用了正确表 / 字段；筛选未冲突。
返回按钮失效→ 手动删除后，重新拖入钻取字段，自动重建返回按钮。
层级钻取无反应→ 开启图表「钻取」开关；确保字段是层级结构而非独立字段。

Power BI 网关作用？

Power BI 网关（On-premises Data Gateway）是连接本地数据源与 Power BI 云端服务的安全桥梁，核心是让云端能安全访问内网 / 本地数据、实现自动刷新。

核心作用

打通本地与云端、安全传输、自动刷新、权限管控、多服务复用。

详细作用拆解

1. 本地↔云端数据互通（最核心）

解决：Power BI 服务（云端）无法直接访问内网 / 本地数据源（SQL Server、本地 Excel、Oracle、SAP、文件共享等）。原理：网关安装在本地服务器 / 电脑，作为中转代理，接收云端查询 → 访问本地数据 → 加密返回云端。场景：发布到 Power BI Service 的报表，要刷新本地数据，必须用网关。

2. 安全数据传输

全程 TLS 1.2 加密，通过 Azure Service Bus 建立安全通道。数据源凭据加密存储在云端，仅在网关本地解密使用。不要求开放本地网络入站端口，降低安全风险。

3. 数据自动 / 计划刷新

支持在 Power BI Service 设置定时刷新（每日 / 每周 / 每小时），保持报表实时更新。支持手动刷新与增量刷新，适配大数据量场景。

4. 权限与访问管控

网关管理员可添加 / 管理数据源，分配使用权限。控制哪些用户 / 报表可通过网关访问哪些本地数据，实现最小权限原则。

5. 多服务复用

一个网关可同时服务 Power BI、Power Apps、Power Automate、Azure Logic Apps、Azure Analysis Services。企业级统一部署，减少重复安装与维护。

6. 支持复杂数据源

兼容各类本地数据源：关系型数据库（SQL Server、MySQL、Oracle）、文件（Excel、CSV、文件夹）、ERP/CRM（SAP、Dynamics）、BI 工具（SSAS）等。

模式	适用场景	共享性	支持服务	安装位置
标准模式（Standard）	企业 / 团队、多用户、多数据源	共享（多人可用）	Power BI、Power Apps、Power Automate 等	服务器（24/7 在线）
个人模式（Personal）	个人报表、仅自己使用	不共享（仅本人）	仅限 Power BI	个人电脑（需保持开机）

关键前提

网关所在机器必须联网、保持开机，否则刷新失败。
数据模型关系正确，数据集已映射到网关与数据源。

总结

Power BI 网关是本地数据上云的安全通道，实现云端报表自动刷新、权限管控，支持企业级多服务复用。

工作区权限有哪几种？

Power BI 工作区提供 4 种标准角色，按权限从低到高为：Viewer（查看者）→ Contributor（贡献者）→ Member（成员）→ Admin（管理员）。

角色	核心权限	适用场景
Viewer（查看者）	仅查看 / 交互报表 / 仪表板；读取数据流；强制执行 RLS	业务人员、只读 stakeholder
Contributor（贡献者）	可创建 / 编辑 / 删除 / 复制 / 发布内容；配置数据集刷新、修改网关；无用户管理与发布应用	开发人员、报表制作、不管理权限
Member（成员）	含 Contributor 全部权限；可管理工作区设置、添加 / 移除用户（至 Viewer/Contributor）；可发布 / 更新应用	团队负责人、需协作与发布权限
Admin（管理员）	最高权限：管理工作区（创建 / 删除 / 设置）、全用户管理、全内容与应用管理、网关 / 刷新全控制	工作区所有者、IT / 数据治理管理员

用户管理：Admin 可管理所有角色；Member 仅能加 / 移除用户至 Viewer/Contributor；Contributor/Viewer 无此权限。
应用管理：Admin 可发布 / 更新应用；Member 可发布 / 更新应用；Contributor 需 Admin 授权；Viewer 无。
RLS 生效：仅 Viewer 强制执行 RLS；Admin/Member/Contributor 会绕过 RLS（注意权限分配）。
权限叠加：用户属多组时，取最高权限角色。

除 “查看与交互” 外，所有操作需 Power BI Pro 或 PPU（Premium Per User） 授权。

应用（App）与工作区区别？

在 Power BI 中，工作区（Workspace）是协作开发的 “容器 / 工作台”，应用（App）是面向最终用户的 “只读分发包”。两者是开发→发布→消费的上下游关系，核心区别如下。

1. 工作区（Workspace）

本质：团队协作的开发 / 测试 / 管理环境，是报表、数据集、仪表板、数据流的原始容器。
定位：生产车间，用于编辑、协作、迭代、调试。
权限：4 种角色（Admin/Member/Contributor/Viewer），支持编辑 / 修改 / 删除 / 发布。
特点：可编辑、可协作、可管理，内容实时更新。

2. 应用（App）

本质：从工作区打包发布的只读、可分发的成品。
定位：交付产品，面向业务用户 / 管理层做只读查看与交互。
权限：仅查看 / 交互，不可编辑；权限独立于工作区，可按用户 / 组 / 全组织分发。
特点：只读、统一入口、版本化发布、受众可控。

对比维度	工作区（Workspace）	应用（App）
核心用途	团队协作开发、内容管理、测试、迭代	面向最终用户的只读分发、统一入口、大规模共享
编辑权限	支持编辑 / 修改 / 删除 / 发布（Contributor+）	完全只读，仅可查看 / 交互 / 导出，不可编辑
用户角色	4 种：Admin/Member/Contributor/Viewer	仅 “查看者” 权限，无角色分级
内容来源	原始报表 / 数据集 / 仪表板 / 数据流	从工作区选择内容打包发布的副本（快照）
更新机制	实时生效（修改即更）	需手动发布新版本，用户看到的是上一次发布的版本
分发范围	仅限工作区成员（需 Pro/PPU）	可分发至全组织 / 部门 / 特定用户 / 组，部分用户无需 Pro
入口位置	Power BI 左侧「工作区」列表	Power BI 左侧「应用」列表，或通过链接安装
数量关系	1 个工作区可发布1 个应用（传统）；预览版可发布多个组织应用	1 个应用仅来自 1 个工作区
RLS 生效	Admin/Member/Contributor 绕过 RLS；仅 Viewer 强制执行	所有用户强制执行 RLS，严格按数据集权限访问
License 要求	所有成员需 Power BI Pro / PPU	查看者：免费版可查看（共享容量）；发布者需 Pro/PPU

工作区负责 “做”（开发协作），应用负责 “发”（分发消费）；先在工作区开发，再发布为应用给用户看。

常见误区澄清

“应用是工作区的子集” ✅

应用是从工作区挑选部分内容打包发布，不是全部内容自动同步。

“修改工作区内容，应用自动更新” ❌

工作区修改后，必须重新发布应用，用户才会看到新版本。

“应用权限 = 工作区权限” ❌

应用权限独立于工作区，可给非工作区成员授权访问应用。

“我的工作区可以发布应用” ❌

仅团队工作区可发布应用，我的工作区不能发布。

总结

工作区是协作开发的容器，支持编辑与 4 种角色；应用是只读分发包，面向用户查看，需从工作区发布，权限独立且强制执行 RLS。

Power BI 订阅（Subscribe）作用？

Power BI 的订阅（Subscribe） 核心作用是：按你设定的时间 / 频率，自动把报表 / 仪表板的快照 + 链接（或附件）发到指定邮箱，让你和相关人不用登录 Power BI 也能定时收到最新数据。

核心价值

自动定时推送、免登录查看、按筛选订阅、批量分发、统一数据口径、提升协作效率。

详细作用

1. 自动定时推送（最核心）

按日 / 周 / 月 / 数据刷新后发送邮件，包含报表 / 仪表板截图快照 + 直达链接；可指定具体时间（如每天 8:00、每周一 9:00），确保在需要时收到；解决 “每天手动打开 Power BI 看数据” 的重复劳动。

2. 免登录查看，随时随地获取数据

收件人无需登录 Power BI，在邮箱即可看到最新数据快照；点击链接可跳转到 Power BI 深入分析，兼顾 “快速概览” 与 “深度分析”。

3. 按当前筛选 / 切片器订阅（精准推送）

订阅时保留当前筛选 / 切片器状态（如只看华东区、2026 年 Q1）；每个人可订阅自己关心的视图，避免收到无关数据。

4. 批量订阅他人（团队 / 管理层分发）

可批量添加收件人（同事、领导、部门组），一次性完成全员订阅；确保所有人收到同一时间、同一口径的数据，避免信息差；适用场景：每日销售日报、每周运营周报、每月财务月报。

5. 支持附件格式（离线可用）

Premium 容量下，可发送 PDF/PPT 附件，方便离线查看、打印、转发；分页报表（Paginated Report）订阅默认带 PDF 附件。

6. 动态订阅（高级，Premium 专属）

按收件人自动筛选数据：如给每个销售经理只发他负责区域的数据；基于语义模型（数据集）动态匹配收件人邮箱 + 筛选条件，实现 “千人千面” 推送。

7. 权限与合规

订阅继承报表权限：收件人必须有报表查看权限才能收到（防止泄密）；所有订阅强制执行 RLS，确保数据安全；管理员可接管 / 管理所有订阅，离职人员订阅可一键停用。

订阅 vs 分享 vs 应用

方式	核心特点	适用场景
订阅（Subscribe）	定时自动发邮件、快照 + 链接、可筛选	日常定时推送、管理层日报 / 周报
分享（Share）	一次性 / 手动发链接、需登录查看	临时协作、单条数据分享
应用（App）	只读分发包、统一入口、可大规模分发	正式对外发布、全员统一查看

关键限制

订阅他人需 Power BI Pro/PPU license；免费版用户只能订阅自己，不能订阅他人；每个报表 / 仪表板最多 24 个订阅；动态订阅仅 Premium/Fabric 容量支持。

总结

订阅是 Power BI 的自动定时邮件推送功能，按设定频率发送报表 / 仪表板快照 + 链接，支持按筛选订阅、批量分发他人，Premium 可发附件与动态筛选，用于日常数据同步与团队协作。

性能分析器（Performance Analyzer）做什么？

性能分析器（Performance Analyzer）是 Power BI 内置的性能诊断工具，用于记录和分析报表在加载、筛选、交互时的各项耗时，帮助找到报表卡顿、缓慢的原因。

主要作用：

查看每个视觉对象从查询到渲染完成的总耗时
把耗时拆分为 DAX 查询、视觉显示等环节，定位瓶颈
复制视觉对象生成的 DAX 查询，方便单独调试优化
对比优化前后的报表速度，验证优化效果
找出哪些图表、度量值或查询导致报表加载变慢

简单说，它就是用来排查报表慢、找到慢的根源、验证优化效果的工具。

DAX Studio 用来干嘛？

DAX Studio 是专门用来分析、优化、调试 Power BI 数据集的专业工具，核心就是处理 DAX 性能问题。

主要用途：

运行、编辑、格式化 DAX 查询，查看详细执行结果
分析查询执行计划，看是存储引擎慢还是公式引擎慢
查看查询使用的服务器时间、行数、内存等性能指标
追踪报表里慢的度量值，定位性能瓶颈
导出数据、查看表结构、元数据信息
对比优化前后的 DAX 速度，验证优化效果

简单说：Power BI 里看大致快慢，DAX Studio 用来深度查 DAX 为什么慢、怎么优化。

FineBI

什么是FineBI？

FineBI 是帆软软件推出的自助式商业智能（BI）与大数据分析平台，主打零代码 / 低代码拖拽分析、可视化仪表板、多维探索、企业级数据治理，核心目标是让业务人员自主做数据分析、实现 “人人都是分析师”。

核心定位与定位

产品定位：新一代自助式 BI，面向业务人员 / 数据分析师 / 管理者，替代传统复杂报表，支持敏捷探索与实时监控。
市场地位：连续多年国内 BI 市场占有率第一，Gartner ABI 魔力象限入选的中国独立 BI 厂商。
核心价值：打通数据接入→建模→分析→可视化→共享→移动端全链路，解决数据孤岛、口径不一、分析效率低等问题。

核心能力

1. 多源数据接入

支持关系型数据库（MySQL/Oracle/SQL Server）、大数据（Hive/Spark）、文件（Excel/CSV）、API、ERP/CRM 等 30 + 数据源，一键整合FineBI。

2. 自助数据建模（零代码）

自助数据集：拖拽完成过滤、关联、计算列、行列转换、缺失值处理。
星型 / 雪花模型、多表 JOIN/UNION，支持抽取（Spider）与实时双引擎FineBI。
指标中心：统一定义、复用、审批核心指标，解决口径混乱FineBI。

3. 可视化与自助分析

拖拽式制作图表：折线 / 柱状 / 饼图 / 地图 / 交叉表 / KPI 卡等，支持 AI 智能图表。
钻取、联动、跳转、参数动态筛选，支持多维探索。
仪表板 / 管理驾驶舱，支持 PC + 移动端（APP / 小程序 / H5）。

4. 企业级管控

三级权限：数据权限（行 / 列过滤）、资源权限（查看 / 编辑）、功能权限。
缓存 / 定时更新、集群部署、高并发、亿级数据秒级响应FineBI。
协作共享、订阅推送、异常告警（钉钉 / 企业微信）。

5. 高级功能

LOD 详细级别表达式（FIXED/INCLUDE/EXCLUDE），脱离视图维度独立聚合。
JavaScript 自定义交互、条件格式、超级链接。
AI 自然语言问答、数据血缘、自动预警。

三、典型应用场景

销售 / 运营实时监控看板
财务 / 人力多维分析
生产 / 供应链数据预警
管理驾驶舱、移动办公
业务自助探索、数据口径统一

四、与传统报表（如 FineReport）的区别

维度	FineBI	FineReport
定位	自助式 BI、探索分析、可视化	传统报表、固定格式、复杂填报
操作	拖拽式、零代码、自助建模	单元格设计、模板化、强格式
场景	实时监控、多维探索、业务自助	固定报表、复杂打印、数据填报
技术	OLAP、可视化、大数据引擎	报表引擎、填报、复杂格式

总结

FineBI 是国产领先的自助式 BI 平台，以低门槛、强可视化、全链路数据治理、企业级安全为核心，帮助企业快速落地数据驱动决策，实现全员数据赋能。

FineBI 核心定位与优势是什么？

FineBI 是帆软推出的企业级自助式 BI 平台，面向业务人员、分析师和管理者，提供从数据连接、数据建模、自助分析到可视化看板、共享协作的一站式数据分析能力，实现低门槛、敏捷、自助化的数据决策支持。

1. 易用性强，零代码拖拽分析

全可视化操作，业务人员无需写 SQL 即可自主做报表和看板。
学习成本低，上手快，真正实现 “人人可用”。

2. 多数据源统一整合

支持关系库、大数据、Excel、API、ERP 等几乎所有数据源。
可跨库关联，解决企业数据孤岛问题。

3. 强大的自助数据建模能力

自助数据集支持过滤、聚合、计算、行列转换、多表关联等。
支持实时直连与抽取数据双模式，兼顾灵活性与性能。

4. 丰富的可视化与交互体验

图表类型齐全，支持地图、钻取、联动、跳转、参数筛选。
仪表板美观，可快速搭建管理驾驶舱、业务监控看板。

5. 企业级权限与安全管控

完善的用户 / 角色 / 部门权限体系。
支持行级、列级数据权限，实现 “一人一数” 的精细化控制。

6. 大数据高性能

内置高性能引擎，亿级数据也能实现秒级响应。
支持缓存、增量更新、集群部署，高并发场景稳定。

7. 完善的共享与协作机制

支持仪表板分享、订阅推送、异常预警。
可在 PC、移动端、小程序多端查看，适配企业办公场景。

8. 国产化与生态适配

全面支持国产数据库、国产操作系统。
适合政务、金融、制造等对信创要求高的行业。

FineBI与FineReport的核心区别？

FineBI 与 FineReport 是帆软旗下定位完全不同的两款产品：FineReport 是专业报表工具，FineBI 是自助式 BI 平台，核心差异在于用户、场景、操作、数据模型、引擎与交互五大维度。

核心定位

FineReport：IT 主导、专业报表、固定格式、复杂填报、合规打印，解决 “我知道要什么报表，交给 IT 做出来”。
FineBI：业务主导、自助分析、多维探索、可视化看板、敏捷决策，解决 “我有数据，自己探索找答案”。

对比维度	FineReport（专业报表）	FineBI（自助式 BI）
核心定位	企业级专业报表开发平台	企业级自助式 BI 分析平台
目标用户	IT 人员、报表开发工程师	业务分析师、业务人员、管理者
设计理念	格式化、精细控制、开发者驱动	灵活敏捷、易用性、业务自助
操作方式	类 Excel 单元格设计、写 SQL、模板化开发	纯 BS 端拖拽式、零代码、自助建模
数据模型	关系型、SQL 直连、数据集固定	多维模型、自助数据集、Spider 引擎、实时 / 抽取双模式
核心场景	固定报表、复杂报表、数据填报、批量打印、合规报送	自助分析、多维探索、可视化看板、管理驾驶舱、敏捷决策
交互能力	弱交互、静态展示为主	强交互：钻取、联动、跳转、筛选、参数
学习成本	高，需 SQL 与报表开发基础	低，业务人员可快速上手
典型产出	月报 / 季报 / 年报、财务三表、复杂套打报表	实时监控看板、多维分析报告、自助探索仪表盘

1. 用户与权限逻辑

FineReport：IT 集中开发、统一发布，业务仅查看，强管控、统一口径。
FineBI：业务自主建表、自主分析，IT 负责数据接入与权限，松管控、敏捷赋能。

2. 数据引擎与性能

FineReport：依赖数据库性能，SQL 直连，适合固定报表批量输出。
FineBI：内置Spider 列式存储引擎，支持实时 / 抽取双模式，亿级数据秒级响应，适合多维探索。

3. 报表 vs 分析

FineReport：擅长中国式复杂报表（多表头、斜线、套打、复杂计算），格式精准、可打印。
FineBI：擅长可视化与交互分析，图表丰富、支持钻取联动，不追求极致打印格式。

4. 开发 vs 自助

FineReport：开发周期长，需求→IT 开发→测试→发布，适合稳定、长期的固定报表。
FineBI：敏捷迭代，业务人员当天需求当天出看板，适合快速变化的业务分析。

总结

FineReport 做 “固定报表”，FineBI 做 “自助分析”；FineReport 是 IT 的工具，FineBI 是业务的武器。

FineBI支持哪些数据源？

FineBI 支持关系型数据库、NoSQL、大数据平台、文件、云服务、API、国产数据库、业务系统等几乎全品类数据源，覆盖企业数据整合全场景。

一、关系型数据库（最常用）

主流：MySQL、Oracle、SQL Server、PostgreSQL、DB2、Informix、Sybase
国产：达梦、人大金仓（Kingbase）、南大通用（Gbase）、OceanBase、TiDB
连接方式：JDBC/ODBC 原生直连，支持多版本兼容

二、NoSQL 数据库

MongoDB、Redis、HBase、Elasticsearch、Cassandra
连接：API / 驱动 / 插件，适配非结构化、日志、缓存场景

三、大数据平台（海量数据）

Hadoop 生态：Hive、Spark SQL、Impala、Kudu、Presto
MPP 数仓：Greenplum、Vertica、ClickHouse、阿里云 AnalyticDB、华为 GaussDB (DWS)
实时数仓：Kafka、Flink（通过插件 / API）

四、文件型数据源（本地 / 上传）

Excel（.xlsx/.xls）、CSV、TXT、JSON、XML、Parquet、Avro
支持：批量上传、定时同步、自动识别格式

五、云平台与云数据库

公有云：阿里云 RDS/MaxCompute、腾讯云 DB、AWS Redshift、Azure SQL、Google BigQuery
云存储：阿里云 OSS、腾讯云 COS、AWS S3（通过插件 / API）
SaaS：Salesforce、钉钉、企业微信、飞书（API 对接）

六、API 与程序数据源

RESTful API、HTTP 接口、WebService、JSON/XML 接口
程序数据集：Java 程序、存储过程、自定义脚本

七、行业与业务系统

ERP：SAP HANA、SAP BW、金蝶、用友、浪潮、鼎捷
MES、WMS、POS、OA、CRM 等（直连数据库或 API）

八、其他扩展

多维数据库：Essbase、SSAS、SAP BW
自定义：第三方 JDBC/ODBC 驱动、插件开发，接入特殊数据源

总结

FineBI 支持关系型、NoSQL、大数据、文件、云、API、国产库、业务系统等全类型数据源，通过 JDBC/ODBC/API/ 插件等方式实现全域数据接入，是企业数据整合的核心能力FineBI。

FineBI的核心使用流程是什么？

数据连接：配置并连接各类数据源（数据库、Excel、API 等）。
数据准备：创建业务包、数据表，进行字段管理、权限设置。
自助数据集建模：对表进行关联、过滤、新增计算字段、聚合、行列转换等处理。
可视化分析：拖拽维度与指标，选择图表组件，制作图表、交叉表、指标卡。
仪表板制作：布局排版、设置筛选器、组件联动、钻取、跳转、条件格式。
发布与共享：发布仪表板到平台，配置查看 / 编辑权限。
定时更新与订阅：设置数据定时刷新，配置邮件 / 企业微信订阅推送。
移动端查看与应用：在 APP、小程序、H5 上查看仪表板，实现移动决策。

FineBI 中的业务包 / 数据集

业务包（Business Package）

业务包是 FineBI 里对数据进行统一管理的 “数据文件夹 / 数据空间”，是权限管控、资源组织的基本单元。

作用：

归类管理多张数据表、数据集
统一设置数据权限、行权限、列权限
控制哪些用户 / 角色可以使用里面的数据
隔离不同业务线（销售业务包、财务业务包等）

业务包 = 数据的容器 + 权限边界

数据集（Dataset）

数据集是最终用来做图表分析的 “可用数据集合”，是从原始数据加工后得到的结构化数据。

常见类型：

原始数据表直接从数据库 / Excel 读取的表，未加工。
SQL 数据集自己写 SQL 查询出来的结果集。
自助数据集拖拽方式做了关联、过滤、聚合、计算列等处理的数据集（最常用）。
关联数据集多表 JOIN / UNION 合并后的宽表数据集。

数据集 = 可直接拖拽做可视化分析的数据表

业务包 ↔ 数据集的关系

业务包包含多个数据集
数据集必须放在某个业务包里
权限控制在业务包级别，包里的所有数据集继承权限
业务人员分析时，只能看到自己有权限的业务包和数据集

总结

业务包：数据的管理容器，用于归类表和控制权限。
数据集：经过处理、可直接用于分析的数据集合，包括原始表、SQL 数据集、自助数据集等。
关系：业务包包含数据集，权限控制业务包，数据集用于做图表。

什么是自助数据集？创建方式有哪些？

自助数据集是 FineBI 中面向业务人员、基于原始数据进行二次加工的中间数据层，可以在不写 SQL 的情况下，通过拖拽完成表关联、过滤、聚合、新增计算列、行列转换、数据清洗等操作，最终形成可直接用于可视化分析的数据集。

简单理解：原始表 = 源数据自助数据集 = 业务人员自己 “整理好” 的可用数据

创建方式

1. 直接拖拽原始表创建

从业务包中将已连接的数据库表 / Excel 表直接拖入，快速生成基础数据集。

2. SQL 数据集创建

编写自定义 SQL 查询，灵活实现复杂逻辑、多表关联、存储过程调用。

3. 自助 ETL 创建（最常用）

通过可视化 ETL 界面，进行过滤、去重、分组聚合、字段拆分、行列转换、追加合并等操作。

4. Excel / CSV 上传创建

直接上传本地文件生成数据集，适合临时、非结构化数据。

5. 关联表创建（多表 JOIN）

将多张表按关键字段做左连接、内连接、全连接、并集（UNION），形成宽表。

6. API / 程序数据集创建

通过接口、Java 程序等动态获取数据并生成数据集。

总结

自助数据集是 FineBI 中对原始数据进行清洗、关联、聚合、计算的业务化数据层。

创建方式主要有：拖拽原始表、SQL 查询、自助 ETL、Excel 上传、多表关联、API 接口。

数据集关联（JOIN）有哪些方式？适用场景？

FineBI 里数据集关联（JOIN）主要分 合并（JOIN） 和 并集（UNION） 两大类

合并关联（JOIN）—— 按列匹配

1. 内合并（Inner Join）

只保留两张表都能匹配上的数据
适用：只想看有交集的有效数据，比如 “有订单的用户”

2. 左合并（Left Join）

保留左表全部数据，右表能匹配就显示，匹配不上显示空值
适用：主表 + 扩展信息，比如 “所有订单 + 对应用户信息”

3. 右合并（Right Join）

保留右表全部数据，左表匹配显示
适用：较少用，一般换成左合并更清晰

4. 全合并（Full Join）

保留两张表所有数据，匹配不上的显示空值
适用：需要查看两边全部数据，包括单边存在的记录

并集（UNION）—— 按行拼接

字段结构相同的多张表，上下拼接行数据
适用：
- 多个月份 Excel 数据合并
- 多个分公司 / 分系统数据汇总
- 历史数据 + 新数据追加

总结

内合并：取两张表的交集。
左合并：保留左表全部，匹配右表（最常用）。
右合并：保留右表全部，匹配左表。
全合并：保留两张表所有数据。
并集：结构相同的表，行拼接汇总。

如何处理数据缺失值/异常值？

缺失值处理

1. 过滤缺失行

直接删除包含缺失值的记录，适用于缺失较少且不影响整体分析的情况。

2. 填充缺失值

填充固定值：如 0、“未知”、“无”
填充统计值：均值、中位数、最大值、最小值
填充前值 / 后值：用上一行或下一行数据填充（适合时序数据）

3. 标记为特殊类别

不删除也不填充，而是新增字段标记 “是否缺失”，用于后续分析。

异常值处理

1. 直接过滤异常范围

设置条件过滤掉明显不合理的数据，例如：

销售额 < 0
数量 > 100000（远超正常范围）

2. 替换为合理值

将异常值替换为均值、中位数、阈值上限 / 下限，避免极端值影响结果。

3. 分箱 / 分段处理

对数值进行分段，把异常值归入极值区间，不参与原始计算。

4. 保留并标注

不删除异常数据，而是单独标记，用于异常检测、风控类分析。

在 FineBI 里具体在哪里操作？

都在 自助数据集 → 自助 ETL 中完成：

过滤：过滤节点
填充缺失值：字段设置 → 缺失值处理
新增计算列 / 标记：新增列
替换异常值：字段替换

总结

缺失值：过滤、填充（固定值 / 均值 / 前后值）、标记特殊值。

异常值：范围过滤、替换为合理值、分箱处理、保留标注。

统一在 FineBI 自助 ETL 中实现处理。

如何在FineBI中进行数据筛选？

FineBI 数据筛选按数据准备层、可视化分析层、仪表板交互层、权限层四大场景划分，覆盖从数据清洗到最终展示的全流程，以下是完整方法与操作路径。

一、数据准备层筛选（自助数据集 / ETL，永久生效）

核心场景：数据清洗、固定范围过滤，减少后续分析数据量。

1. 自助 ETL 过滤（最常用）

入口：自助数据集 → 编辑数据 → 添加「过滤」步骤。
操作：
1. 选择字段（文本 / 数值 / 日期），设置条件（等于 / 大于 / 包含 / 为空等）。
2. 多条件支持且 / 或逻辑，可添加公式过滤（如 销售额>1000 AND 地区='华东'）。
3. 表头快速过滤：点击字段表头 → 选择值 → 自动生成过滤步骤。
适用：缺失值 / 异常值过滤、固定时间 / 区域数据截取。

2. SQL 数据集过滤

入口：新建 SQL 数据集 → 编写 WHERE 子句（如 WHERE order_date>='2025-01-01'）。
适用：复杂逻辑、多表关联后过滤。

3. 关联过滤（JOIN 隐式过滤）

左 / 内合并：通过 JOIN 自动过滤不匹配数据（如内合并只保留两张表交集）。
适用：多表关联时的关联过滤。

二、可视化分析层筛选（组件 / 分析区域，临时生效）

核心场景：制作图表时临时过滤，不影响原始数据集。

1. 明细过滤（过滤原始明细数据）

入口：
- 待分析字段 → 下拉 → 明细过滤。
- 分析区域字段 → 下拉 → 明细过滤。
操作：设置字段条件，过滤后再聚合计算。

2. 结果过滤（过滤聚合后结果）

入口：
- 分析区域指标 → 下拉 → 结果过滤。
- 拖指标到「过滤器」面板 → 选择聚合方式 → 设置条件（如取销售额前 5）。
适用：取 TopN、过滤聚合后异常值（如只看订单量 > 100 的省份）。

3. 组件内过滤

入口：图表组件 → 编辑 → 字段下拉 → 过滤。
适用：单个组件独立过滤，不影响其他组件。

三、仪表板交互层筛选（筛选器 / 联动，用户交互）

核心场景：仪表板发布后，用户交互式筛选。

1. 筛选器组件（公共筛选）

入口：仪表板编辑 → 添加组件 → 筛选器（文本 / 数值 / 日期 / 下拉 / 复选）。
操作：
1. 绑定字段（如地区、日期、产品类别）。
2. 设置默认值、多选 / 单选、范围（如最近 30 天）。
3. 关联目标组件（全局 / 局部生效）。
类型：
- 文本筛选器：包含 / 开头是 / 属于等。
- 数值筛选器：大于 / 小于 / 区间等。
- 日期筛选器：固定日期 / 动态日期（如昨天、本月）。

2. 组件联动 / 钻取

联动：点击图表数据点，自动过滤其他组件（如点击「华东」，所有图表只显示华东数据）。
钻取：下钻到明细数据（如从省份钻取到城市）。

3. 通用查询组件

入口：仪表板 → 添加「通用查询」，支持多字段组合查询。
适用：复杂多条件查询场景。

四、权限层筛选（数据权限，强制生效）

核心场景：控制不同用户看到的数据范围（如销售经理只看自己区域数据）。

入口：管理系统 → 业务包 → 数据权限 → 行权限 / 列权限。
操作：设置过滤条件（如 地区=当前用户所属区域），用户登录后自动过滤。

五、筛选方式对比

筛选层级	操作位置	生效范围	适用场景
数据准备	自助 ETL/SQL	永久，全流程	数据清洗、固定范围
可视化分析	明细 / 结果过滤	临时，当前分析	图表制作时临时过滤
仪表板交互	筛选器 / 联动	交互，用户可控	发布后用户筛选
权限控制	业务包权限	强制，用户不可改	数据安全、权限隔离

六、操作步骤速记

数据准备：自助 ETL 加「过滤」步骤，设置条件永久生效。
分析制作：用明细 / 结果过滤，临时调整图表数据。
仪表板：添加筛选器组件，绑定字段实现交互筛选。
权限：业务包设置行 / 列权限，控制用户可见数据。

如何在FineBI中进行数据排序？

FineBI 里排序主要分组件内排序、维度排序、指标排序、自定义排序四种

一、组件内快速排序（最常用）

进入仪表板编辑，选中图表 / 表格
点击字段旁的 ↑ 升序 / ↓ 降序 图标
选择按 维度排序 或 指标排序

适用：表格、柱状图、折线图等快速排序。

二、按维度排序

对地区、产品、类别等文本维度排序：

点击维度字段下拉箭头
选择 升序 / 降序
可按 字母序、数值序 排列

三、按指标排序（TopN 必备）

按销售额、数量等指标大小排序：

点击指标字段下拉
选择 升序 / 降序
图表会自动按指标大小重新排列

四、自定义排序（固定顺序）

比如：华东、华南、华北… 固定顺序

维度字段 → 下拉 → 自定义排序
手动拖动成员调整顺序
保存后全局生效

适用：地区、部门、状态等固定业务顺序。

五、结果集排序（聚合后再排）

在自助数据集 / SQL 中：

自助 ETL：添加排序步骤
SQL 数据集：使用 ORDER BY 字段 ASC/DESC

总结

组件内快速升降序
按维度字母 / 数值排序
按指标大小排序（TopN）
自定义固定顺序排序
自助 ETL 或 SQL 结果集排序

如何在FineBI中进行数据透视分析？

在 FineBI 里做数据透视分析（行、列、指标多维交叉分析），核心就是用交叉表 + 拖拽维度 / 指标，再配合钻取、筛选、排序实现。

核心操作步骤

1. 新建仪表板 / 组件

2. 选择「交叉表」组件

3.拖入字段

行：拖入行维度（如地区、产品类别）
列：拖入列维度（如年、月、渠道）
指标：拖入要计算的值（如销售额、订单量、利润）

4. 设置汇总方式

对指标选择：求和、计数、平均值、最大值、最小值等

5. 添加筛选器 / 排序

按时间、地区筛选，按指标大小排序

6. 开启钻取、联动

实现从汇总到明细的下钻分析

关键功能

行维度、列维度多层级：可拖多个字段实现多层透视（如地区→城市→门店）
指标多值并排：同时显示销售额、毛利、毛利率等多个指标
总计 / 小计：自动显示行总计、列总计、分类小计
条件格式：数据条、色阶、图标集，直观展示大小
行列切换：一键交换行和列维度，快速切换分析视角

与 Excel 数据透视表对比

FineBI 交叉表 = Excel 数据透视表
行字段 = 行
列字段 = 列
指标 = 值
筛选器 = 页字段 / 筛选器

总结

FineBI 的数据透视分析通过交叉表组件实现，将维度拖入行和列、指标拖入值区域，配合汇总、筛选、钻取、条件格式，完成多维交叉汇总分析。

FineBI中参数的样式与用法？

FineBI 参数是可动态赋值的变量，用于实现动态筛选、动态计算、SQL 传参、联动交互，是实现灵活分析的核心工具。下面从参数类型 / 样式、创建与绑定、核心用法、实战场景四方面详细说明。

一、参数类型与样式（按数据类型 + 交互样式）

1. 按数据类型分类（核心）

参数类型	说明	适用场景	交互样式
文本参数	字符串 / 枚举值	地区、产品、部门、状态	下拉单选 / 多选、文本输入、列表、级联
数值参数	整数 / 小数	阈值、金额、数量、比例	数值输入、下拉、滑块、区间
日期 / 时间参数	日期 / 时间	时间筛选、同比 / 环比	日期选择器、年月 / 季度 / 周、时间区间
布尔参数	是 / 否	开关、条件判断	单选按钮、下拉（是 / 否）

2. 按作用范围分类

全局参数：整个系统 / 所有主题可用
主题参数：当前分析主题内可用（最常用）
组件参数：仅当前组件内使用

3. 交互样式（过滤组件绑定后）

下拉单选 / 多选
文本输入框
日期 / 时间选择器
数值滑块 / 区间
级联下拉（如省→市→区）
列表 / 复选框

二、参数创建与绑定（实操步骤）

1. 创建参数（两种入口）

方式 1：主题内新建参数（推荐）

进入数据分析 → 打开分析主题
顶部菜单：参数 → 新建参数
填写：参数名、类型、默认值、是否多选、是否必填
保存

方式 2：SQL 数据集直接定义（${}）

在 SQL 中用 ${参数名} 定义，系统自动识别为参数：

SELECT * FROM 订单 WHERE 地区 = '${地区参数}' AND 销售额 > ${阈值参数}

2. 参数绑定（三大场景）

（1）绑定过滤组件（实现交互筛选）

仪表板编辑 → 添加过滤组件（文本 / 数值 / 日期）
组件设置 → 绑定参数 → 选择已创建的参数
配置样式（单选 / 多选、默认值、可选值）帆软

（2）绑定计算字段（动态计算）

在计算字段中直接引用参数：

IF(销售额 > ${阈值}, "大额订单", "小额订单")

（3）绑定 SQL 数据集（动态取数）

在 SQL 中用 ${参数名} 接收值，实现动态 WHERE 条件。

三、核心用法（高频场景）

1. 动态筛选（最常用）

用文本 / 日期 / 数值参数绑定过滤组件，实现灵活筛选
支持多选、区间、级联

2. 动态计算（计算字段 + 参数）

动态阈值：销售额 > ${阈值}
动态同比 / 环比：

DEF(SUM_AGG(销售额), [], [YEAR(日期)=YEAR(${日期参数})-1])

动态分组：按参数值分段

3. SQL 传参（性能优化）

在 SQL 中用参数做前置过滤，减少数据加载量
示例：

SELECT * FROM 销售表
WHERE 日期 BETWEEN ${开始日期} AND ${结束日期}
AND 区域 IN (${区域参数})

4. 联动与交互

一个参数绑定多个组件，实现全局联动
组件间通过参数传值，实现钻取、跳转

5. 默认值与空值处理

设置默认值，打开仪表板自动加载初始数据
空值时用 IF(len(${参数})=0, "全部", ${参数}) 处理

四、实战示例

示例 1：动态阈值判断（数值参数）

新建数值参数：阈值，默认值 10000
计算字段：订单类型 = IF(销售额 > ${阈值}, "大额", "小额")
仪表板添加数值过滤组件，绑定阈值
拖动滑块，图表自动区分大小订单

示例 2：动态时间同比（日期参数）

1. 新建日期参数：统计日期

2. 计算字段：

当年销售额：DEF(SUM_AGG(销售额), [], [YEAR(日期)=YEAR(${统计日期})])
去年同期：DEF(SUM_AGG(销售额), [], [YEAR(日期)=YEAR(${统计日期})-1])

3. 绑定日期过滤组件，切换日期自动刷新同比

示例 3：SQL 动态过滤（多参数）

SELECT * FROM 订单
WHERE 1=1
${IF(len(${区域})=0, "", "AND 区域 IN ('" + ${区域} + "')")}
${IF(len(${日期})=0, "", "AND 日期 >= '${日期}'")}
AND 销售额 > ${阈值}

总结

FineBI 参数是动态变量，按类型分文本、数值、日期，按范围分全局 / 主题 / 组件。核心用法：

绑定过滤组件实现交互筛选
参与计算字段实现动态计算
嵌入 SQL实现动态取数与性能优化
全局联动实现一屏多态分析

参数 = 动态变量，用于筛选、计算、传参、联动。

FineBI如何实现数据钻取/联动/跳转？

在 FineBI 中，钻取、联动、跳转是三大核心交互能力，分别对应明细下钻、组件同步、跨页导航。

一、数据钻取（Drill）

1. 概念

从汇总数据逐层下钻到明细（如：年→季→月→日、大区→省份→城市），也可上卷返回汇总。

本质：维度层级化，通过「钻取目录」定义父子关系。
适用：时间、地区、组织、产品等层级维度。

2. 实现步骤（普通钻取，最常用）

步骤 1：创建钻取目录（核心）

进入数据分析→打开分析主题→新建组件（如柱状图）。
在待分析区域→维度，右键目标字段（如「省份」）→创建钻取目录，命名（如「地区层级」）。
将下一层字段（如「城市」「区县」）拖拽到钻取目录下，按业务顺序排列。
（可选）点击钻取目录→设置钻取顺序：固定 / 不固定。

步骤 2：组件配置与预览

将钻取目录字段（如「地区层级」）拖入横轴 / 维度区，指标拖入纵轴 / 指标区。
保存组件→进入仪表板预览。
点击图表数据点→下钻；点击顶部层级→上卷。

3. 特殊钻取（快速配置）

日期钻取：直接用「日期」字段，系统自动生成年→季→月→日层级，无需手动建目录。
地图钻取：将字段转为地理角色（省 / 市 / 区），地图组件自动支持下钻。

4. 实战要点

钻取目录必须按业务逻辑排序（父→子），顺序错误会导致路径断裂。
横轴 / 维度区只能放一个钻取目录，不可同时放多个平铺维度。
明细表 / 分组表同样支持钻取，用于查看最明细数据。

二、数据联动（Linkage）

1. 概念

点击一个组件的数据，其他关联组件自动同步筛选，实现 “一触即变”。

本质：组件间数据过滤传递，基于字段关联。
适用：同仪表板内多组件协同分析（如地图 + 柱状图 + 表格）。

2. 实现方式（两种）

方式 1：系统默认联动（最省事）

所有组件基于同一张表 / 关联好的多张表制作。
仪表板中，系统自动建立默认联动，无需手动设置。
预览：点击任意组件数据，其他组件自动过滤。

方式 2：手动 / 自定义联动（精准控制）

进入仪表板编辑→选中源组件（如地图）→点击右上角联动设置。
在弹出窗口：
- 勾选需要联动的目标组件（可多选）。
- 设置联动关系：双向 / 单向、是否启用。
- （可选）自定义联动条件（如仅按「省份」联动）。
保存→预览验证。

3. 实战要点

明细表 / 文本组件只能被联动，不能作为源触发联动。
过滤组件不参与联动，仅用于全局筛选。
跨表联动：需先在数据建模中建立表间关联（如订单表。省份 = 地区表。省份）。
清除联动：点击组件左上角「清除联动项」或仪表板顶部「清除所有联动」。

三、数据跳转（Jump / 超级链接）

1. 概念

点击组件数据，跳转到其他仪表板、FineReport 报表或外部网页，并可传递参数实现精准过滤

本质：页面导航 + 参数传递，打通多页面分析。
适用：从汇总看板跳转到明细看板、跨系统链接、报表穿透。

2. 实现步骤（跳转到仪表板，最常用）

步骤 1：准备目标页面

先制作好跳转目标仪表板（如「城市销售明细」），并确保有可接收参数的字段 / 过滤组件。

步骤 2：设置跳转与传参

1. 进入源仪表板编辑→选中源组件（如省份地图）→点击右上角跳转设置帆软。

2. 点击 + 添加跳转 →选择分析模板（跳转到自己的仪表板）或网页链接（跳转到他人 / 外部）。

3. 配置：

目标：选择已做好的目标仪表板。
打开位置：新窗口 / 对话框（全屏 / 默认）。
传参设置（关键）：点击自定义→添加源字段→目标字段映射（如源「省份」→目标「省份」）。

4. 保存→预览：点击源组件数据，自动跳转并过滤目标页面数据。

3. 其他跳转场景

跳转到 FineReport 报表：选择「FineReport 模板」，配置参数传递帆软。
跳转到外部网页：输入 URL，可在 URL 中拼接参数（如https://xxx.com?province=${省份}）帆软。
动态跳转：根据字段值跳转到不同链接（需用公式配置）帆软。

4. 实战要点

传参时，源字段与目标字段类型必须一致（文本→文本、日期→日期）。
跳转链接建议用相对路径，避免工程迁移后失效。
目标仪表板需公开 / 授权，否则跳转后无权限查看。

功能	核心作用	实现基础	范围	关键操作
钻取	汇总→明细下钻	维度层级（钻取目录）	单组件内	创建钻取目录→点击下钻
联动	组件间同步筛选	表关联 / 手动设置	同仪表板	联动设置→勾选目标组件
跳转	跨页导航 + 传参	超级链接 + 参数映射	跨仪表板 / 外部	跳转设置→配置目标与传参

总结

钻取：建钻取目录，实现单组件内层级下钻 / 上卷。
联动：基于表关联或手动设置，实现同仪表板组件同步过滤。
跳转：配置超级链接 + 参数传递，实现跨页 / 跨系统导航。

FineBI 计算字段

快速计算
聚合指标
表计算（同环比、占比、排名）

FineBI 权限体系

目录权限
数据权限（行权限、列权限）
部门 / 角色权限

FineBI 怎么做实时数据？

直连数据库
定时刷新
大屏监控

腾讯云开发者社区

腾讯云面向开发者汇聚海量精品云计算使用和开发经验，营造开放的云计算技术生态圈。

更多推荐

终极指南：Flink SQL连接器版本管理从混乱到有序的升级之路

Apache Flink作为流处理领域的佼佼者，其SQL连接器的版本管理一直是开发者面临的核心挑战。本文将系统讲解Flink SQL连接器版本管理的最佳实践，帮助你轻松应对版本兼容性问题，实现从混乱到有序的升级之旅。## 连接器版本管理的常见痛点 😫在Flink应用开发中，连接器版本管理常常让开发者头疼不已。不同版本的连接器可能导致各种兼容性问题，例如API变更、功能差异甚至运行时错误。

腾讯云开发者社区

Elasticsearch复杂数据类型终极指南：从入门到精通

Elasticsearch作为功能强大的搜索引擎，支持多种复杂数据类型，让开发者能够灵活处理各种结构化和非结构化数据。本文将带你全面了解Elasticsearch中的复杂数据类型，从基础概念到实际应用，助你轻松掌握数据建模的核心技巧。## 内部对象：构建层级化数据结构在Elasticsearch中，对象类型（Object）是最基础的复杂数据类型之一，用于表示具有嵌套关系的数据。例如，我们可

腾讯云开发者社区

如何快速搭建Neon无服务器PostgreSQL：面向初学者的完整指南

Neon是一款革命性的无服务器PostgreSQL解决方案，它通过分离存储和计算层，实现了自动扩缩容、类代码式数据库分支以及零级扩展能力。本指南将帮助你从零开始搭建Neon开发环境，体验这款创新数据库的强大功能。## 准备工作：环境要求与依赖项在开始搭建Neon环境前，请确保你的系统满足以下要求：- Linux操作系统（推荐Ubuntu 20.04+或Debian 11+）- Git