( |% q# ?7 Q% [$ X1 V3 Y& f0 N
如果大家对豌豆BI的数据预处理有一定了解的话,就知道数据预处理的简单易用性,可以在数据分析之前,处理数据不完整,重复,异常值等问题,通过简单的界面操作即可完成。通过对用户需求的分析,数据预处理增加了其他更好用的功能,本文将介绍这些简单易操作的功能。
3 ?1 b# i" E" _, h% S/ F& m3 g
1. 字段信息统计
1 o1 _. I$ x, K3 ?4 d! J. V
在查看主题表数据,或进行数据预处理时,可以查到表中所有字段的各种统计信息,如最大值、最小值、唯一值,缺失值个数,合计值,均值,方差值大小,及数据分布情况。
* B- n9 W8 s- I( a
6 O& Z' Y9 e. B7 E4 s
: B( y( F4 G4 a 打开凤凰新闻,查看更多高清图片
2 ]9 I2 L" V6 I h) d6 b- i+ O* n
! s( h3 G' Z/ c3 ~
: d1 M; P: _3 a4 N 2. 筛选生成新表
# q: B! J+ {5 n% R6 ] 对某列数据进行筛选后,工具栏上出现“筛选结果另存为Sheet”按钮,点击后即可将筛选数据存成一张新的表进行处理
1 A! W% }3 y) P% x6 h; w$ b

; u2 [3 |* N2 M. E* o w 同时,可以框选界面中的任意部分数据,右键,点击“框选另存为Sheet”,将框选部分存为一张新表处理
7 V5 N: g- X/ ~/ v! H2 T

0 j/ \! P' M. ^+ A
3. 生成关联数据
_' `1 t4 _, ?$ D5 z& d
选择任意多张表进行关联,表之间可以进行关联后,选择表的字段生成一张新的表,新的表数据是根据设置的关联关系生成。
' f) \$ [2 Y' s6 c+ _$ I
1. 选择表做关联关系
! { Y1 S) o) v! S' y

9 ? K6 A$ E7 y+ V2 k1 [ 2. 设置关联关系类型及关联字段
' }: H. S9 Z+ b

! K. Z" q9 C1 d 3. 选择最终生成关联新表数据需要的字段
1 r- G8 N% R! \" p, X6 r

/ B$ u3 V; R" i; ]- B$ G' {& @0 \) { 4. 主题表数据追加覆盖
) }" Z. x/ I2 `3 f) Y* ?. }3 _: {
可以对主题表的数据进行追加或覆盖操作,此处是选择文件数据源中的文件数据,解析文件,通过设置字段对应关系,将文件中的数据追加或覆盖到主题表中。
$ A1 {) G- G A: V$ J) Y' d
1.操作入口,主题表列表中,主题表后面更多操作中的“追加覆盖数据”按钮:
6 v) I0 F h( t, X5 ^/ ]2 Z1 P8 ? 
" \, X! v2 P/ T, r 2. 选择文件数据源中的文件,点击追加或覆盖
1 u: y$ Y4 G. q

6 u* m0 k1 z% [% W- J: e: O% I* Q6 d
3. 当选择的文件是EXCEL时,可以选择EXCEL文件中用户需要的工作簿,以及设置工作簿数据中的字段起始行及数据起始行
& q% W) h4 x5 ?+ l: y& i5 Q

7 C, M6 m" e6 B3 }0 `& L 4. 进入数据预处理,可进行数据简单的处理后再将数据追加或覆盖到主题表中
! b4 j8 O! t" V; a9 D. f$ h9 w9 P 
' u- ^. E& u* Y( r
5. 点击追加或覆盖,设置字段对应关系,可点击按位置匹配或按名称匹配
|) V0 f4 J4 Z( [

5 j/ O; B& m8 I" [ w 也可针对某一个字段自行选择设置字段对应关系
+ W7 `7 Q' o) t6 J4 V 
+ H+ A# s5 i" d* v
设置完字段对应关系后,点击确定,即可将进行预处理的文件数据追加或覆盖到主题表中
+ A! L r! X. z$ T0 o) n9 F