热门浏览

javaee培训培训模具培训工具培训家具造型设计培训培训手提便携音箱免费培训试验箱培训试验箱培训多功能小吃车驾驶员培训学车

太原大数据面试宝典（分析题）
使用微信扫描二维码分享朋友圈，成交更快更简单！

更新时间：2020-07-13 03:42:03 信息编号：254171573

价格：
面议
版本类型：
其它
关键词：
大数据

李老师查看联系方式

微信在线

获取报价在线咨询

详情介绍

太原大数据面试宝典（分析题）

服务项目

JavaEE培训,Linux,软件测试,云计算

面向地区

山西太原

版本类型

其它

金三银四，正值求职的黄金季节，求职大数据的小伙伴们，看过来了，千锋教育小编给你送福利了，千锋教育大数据面试宝典已经为你备好，请各位小主儿过目。

一、hive的使用，内外部表的区别，分区作用，UDF和Hive优化

(1)hive使用：仓库、工具

(2)hive内外部表：内部表数据删除，外部表数据删除后、其他人依然可以访问

(3)分区作用：防止数据倾斜

(4)UDF函数：用户自定义的函数(主要解决格式，计算问题)，需要继承UDF类

java代码实现

class TestUDFHive extends UDF {

public String evalute(String str){

try{

return "hello"+str

}catch(Exception e){

return str+"error"

(5)Hive优化：看做mapreduce处理

a\排序优化：sort by 效率 order by

b\分区：使用静态分区 (statu_date="20160516",location="beijin")，每个分区对应hdfs上的一个目录

c\减少job和task数量：使用表链接操作

d\解决groupby数据倾斜问题：设置hivegroupbyskewindata=true ，那么hive会自动负载均衡

e\小文件合并成大文件：表连接操作

f\使用UDF或UDAF函数：

二、简要描述如何安装配置一个apache开原本hadoop，只描述即可，无需列出完整步骤，能列出步骤更好。

流程：

1创建hadoop用户

2修改IP

3安装JDK，并配置环境变量

4修改host文件映射

5安装SSH，配置无秘钥通信

6上传解压hadoop安装包

7配置conf文件夹下的hadoop-envsh、core-sitexlmapre-sitexml、hdfs-sitexml

8配置hadoop的环境变量

9Hadoop namenode -format

10start-all

三、MapReduce优化

1 任务调度

I/O 方面：Hadoop 会尽量将 Map 任务分配给 InputSplit 所在的机器，以减少网

络 I/O 的消耗。

2数据预处理与 InputSplit 的大小

合理地设置 block块大小是很重要的调节方式。除此之外，也可以依靠合理地设置 Map 任务的数量来调节 Map 任务的数据输入。

3 Map 和 Reduce 任务的数量

当 Reduce 任务的数量是任务槽的 175 倍时，执行速度快的机器可以获得更多

的 Reduce 任务，因此可以使负载更加均衡，以提高任务的处理速度。

以上大数据的经典面试题，各位小主先用着，待小编深度挖掘千锋教育讲师的满满大数据技术干货库，为大家谋福利！

上一条普陀绿化围栏绿化栅栏》》》不枯朽,不褪色,广西壮族自治贺州编写可行性报告-有资质下一条

软件工程师培训VIP推荐信息

北京千锋互联科技有限公司 7年

主营：ui交互设计培训,php培训,大数据开发培训,python人工智能培训
地址：北京市海淀区宝盛北里西区28号天丰利商城4层

———— 认证资质 ————

个人
营业执照
天眼查
手机
微信

没有个人认证

企业认证已通过

天眼查已核实

手机认证已通过

没有微信认证

太原大数据面试宝典（分析题）
使用微信扫描二维码分享朋友圈，成交更快更简单！

面议

其它

大数据

详情介绍

太原大数据面试宝典（分析题）

软件工程师培训VIP推荐信息

北川羌族自治县物业经理证报名报考信息汇总详细咨询益

泸州合江叉车证培训哪里益进教育为您服务

广州报考物业经理资格证

广安叉车培训拿证流程益进教育为您服务

怎样报考物业经理证吗

冕宁县物业经理证报名报考须知要点详细咨询益进教育

内江市物业经理证报名报考要点解析详细咨询益进教育

物业经理证书多少钱报考

相关推荐产品

留言板

太原大数据面试宝典（分析题） 使用微信扫描二维码分享朋友圈，成交更快更简单！

面议

其它

大数据

详情介绍

太原大数据面试宝典（分析题）

软件工程师培训VIP推荐信息

相关推荐产品

留言板

相关产品

相关分类

热门城市

热门分类

热门产品

太原大数据面试宝典（分析题）
使用微信扫描二维码分享朋友圈，成交更快更简单！