当前位置:通信电子计算机技能考试题库>百度SEM中级认证考试题库

问题:

[多选] 在进行前期数据准备时,为什么需要对原始数据进行清洗:()

经过清洗后的数据更加标准化,便于下一步进行对比分析。将负面数据清洗掉之后,分析结论可以更积极乐观,突出成绩。数据清洗是一个大浪淘沙的过程,只有含金量最高的极小部分数据被保留下来,明显减少分析工作量并提升分析效率。原始数据中可能掺杂噪音、失真或极值,数据清洗将对这些情况进行合适的处理。

问题:

[多选] 适合用于辨别和分析流量作弊行为的维度包括:()

地理位置。IP地址。唯一访客。转化情况。

问题:

[多选] 在对商业目标进行分析时,可以使用哪些数据细分方式?()

新客户vs.老客户。新访客vs.老访客。使用过站内搜索的访客vs.没有使用站内搜索的访客。浏览了重要产品页面的访客vs.没有浏览重要产品页面的访客。

问题:

[多选] 关于数据细分,以下说法正确的是:()

细分可以让你汇总不同报告的数据。细分可以让你单独分析某部分数据。细分是很高级的技巧,只有行业专家才能使用。细分可以帮助你发现整体数据变化的原因。

问题:

[多选] 关于正则表达式,以下说法正确的是:()

正则表达式是一种程序语言,它能够提供准确和灵活的方法帮助我们匹配和过滤文本。正则表达式对于实际工作意义不大。任何时候都应该使用正则表达式。正则表达式使用得当,可以极大提高工作效率。

问题:

[多选] 正则表达式如下所示.“.at”,它能够匹配以下哪些字符:()

Hat。Cat。at。Bat。

问题:

[单选] 对于数据标准化,请将数列50,32,7,25,18,进行归一化处理,其结果是:()

0.82,0.43,0.01,0.33.0.23。1,0.23,-1,-0.15,-0.24。c1,0.58,0,0.42,0.26。d1,0.5,-1,0.1,0.15。

问题:

[多选] 根据来自某媒体广告的访问量数据,下列有作弊嫌疑的情况是?()

来自单个操作系统的访问量占比超过95%。访问者仅来自三个省份。浏览器语言90%是中文。80%的访问量在凌晨2点发生。

问题:

[多选] 请问以下哪些维度可用来识别作弊流量?()

停留时间。分小时流量表。跳出率。点击热力图。

问题:

[单选] 互联网营销分析与优化工作各环节的第一步是:()

确定目标。制定计划。监测布码的实施。定义KPI。