永发信息网

hadoop能不能读写其他格式的文件?怎么读写?

答案:2  悬赏:0  手机版
解决时间 2021-11-13 06:34
  • 提问者网友:爱唱彩虹
  • 2021-11-12 14:36
hadoop能不能读写其他格式的文件?怎么读写?
最佳答案
  • 五星知识达人网友:撞了怀
  • 2021-11-12 15:47
1、默认做wordcount计算是读取txt文本文件的,所以默认wordcount程序只能针对txt文件才行。
2、要想针对doc或excel只要通过pos或tika组件,读取相应的office文件,接入到相应的计数接口就好了。
3、好好看下wordcount的源码你就知道怎么做了,你重写一个相应的wordcount就可以搞定了。
试试看吧。追问我想run on hadoop 而不是 run on java ,是不是必须要用hadoop的API啊?追答1、基实hadoop本身就是由java实现的,只是一个狭义一个广义而已。
2、是必须用hadoop api才可以。因为hadoop是对jdk很多对象的高度封装,像基本数据类型也是进行了相当的封装,里边做了相应的适合分析布式的操作,看下源码就更清楚了。
3、像这样的问题,自己可以浅层次的看下源码,很多问题就一目了然了。
全部回答
  • 1楼网友:迟山
  • 2021-11-12 17:27
可以读写 需要为读写的对象 实现Writable接口追问可不可以说具体一点?写一段代码看看?谢谢你可不可以说具体一点?写一段代码看看?谢谢你
我要举报
如以上回答内容为低俗、色情、不良、暴力、侵权、涉及违法等信息,可以点下面链接进行举报!
点此我要举报以上问答信息
大家都在看
推荐资讯