0 v, m9 k: [: j* E( a! T. q7 f5 r
如果大家对豌豆BI的数据预处理有一定了解的话,就知道数据预处理的简单易用性,可以在数据分析之前,处理数据不完整,重复,异常值等问题,通过简单的界面操作即可完成。通过对用户需求的分析,数据预处理增加了其他更好用的功能,本文将介绍这些简单易操作的功能。
3 R* x) Q! g( @ T2 t
1. 字段信息统计
: Y+ Y: E R6 C2 N; U; t
在查看主题表数据,或进行数据预处理时,可以查到表中所有字段的各种统计信息,如最大值、最小值、唯一值,缺失值个数,合计值,均值,方差值大小,及数据分布情况。
% b) \ U3 u; O2 H; r7 p/ ?
) o) A M. i2 Q# z, S0 O 6 z; F! D+ E( f) f
打开凤凰新闻,查看更多高清图片
+ y/ G* Y) g. N. v* I2 q + E; P5 ~$ t) f6 ~& _8 X
+ P/ u1 V0 `9 v: U# N; U 2. 筛选生成新表
! i. u) U9 e$ m0 {( Y, n$ J 对某列数据进行筛选后,工具栏上出现“筛选结果另存为Sheet”按钮,点击后即可将筛选数据存成一张新的表进行处理
; m- K9 [; a: q8 x. S# b% v) `4 v 
/ N- [8 W$ K- p
同时,可以框选界面中的任意部分数据,右键,点击“框选另存为Sheet”,将框选部分存为一张新表处理
- D0 k0 _. \/ F! |# S. V# G 
- Z( ^3 c- j4 G% I4 W
3. 生成关联数据
, Z$ n2 i2 \9 p 选择任意多张表进行关联,表之间可以进行关联后,选择表的字段生成一张新的表,新的表数据是根据设置的关联关系生成。
w; H/ l1 X! d1 ~% Q$ a
1. 选择表做关联关系
$ C' A8 A" d1 [2 S. A

: k4 m0 q! z/ [3 \
2. 设置关联关系类型及关联字段
" ], n& Y# o. O* u7 D! y& i) ]4 H 
- ^6 d8 m# |) ` 3. 选择最终生成关联新表数据需要的字段
7 \# h( s( | H I8 w2 L 
, {% q/ K1 \3 O* @! r) a; i- M 4. 主题表数据追加覆盖
" w. i; `$ L }6 R+ T: R
可以对主题表的数据进行追加或覆盖操作,此处是选择文件数据源中的文件数据,解析文件,通过设置字段对应关系,将文件中的数据追加或覆盖到主题表中。
; [$ Y6 N+ r# B% P+ d. R4 N
1.操作入口,主题表列表中,主题表后面更多操作中的“追加覆盖数据”按钮:
6 n7 y3 l; u2 k9 M) l' Z 
- U. s1 k8 `: Y J* d4 E4 k 2. 选择文件数据源中的文件,点击追加或覆盖
& C J" G% W. V9 T5 a" Y 
% k1 B( h2 {8 c/ S, B2 m
3. 当选择的文件是EXCEL时,可以选择EXCEL文件中用户需要的工作簿,以及设置工作簿数据中的字段起始行及数据起始行
: {& M1 h* X8 Z1 m- G1 V 
' Q h2 x8 P% e& n
4. 进入数据预处理,可进行数据简单的处理后再将数据追加或覆盖到主题表中
4 J( e" Q" }, W- q. n 
& Y+ i4 l* h" F) ?7 d P 5. 点击追加或覆盖,设置字段对应关系,可点击按位置匹配或按名称匹配
1 {7 X% P1 n' g" n$ Y; R0 r

. K( q- M. [, f4 { 也可针对某一个字段自行选择设置字段对应关系
9 h. ~1 G/ g: `! c' X* x3 i1 V

9 V6 g, M- x3 h) [ 设置完字段对应关系后,点击确定,即可将进行预处理的文件数据追加或覆盖到主题表中
- o5 y% w5 A2 |7 w2 `0 A