永发信息网

如何评价今日头条研发的写稿机器人Xiaomingbot

答案:2  悬赏:30  手机版
解决时间 2021-11-26 12:30
  • 提问者网友:流星是天使的眼泪
  • 2021-11-25 20:44
如何评价今日头条研发的写稿机器人Xiaomingbot
最佳答案
  • 五星知识达人网友:酒醒三更
  • 2021-11-25 22:06
看了一下这个项目团队发表在ACL2016论文,其实是一个句子选取(sentence selection)的问题,主要工作是从体育赛事的文字直播中选取重要的句子组合成一篇针对该场比赛的新闻报道。
实验数据集:150场足球赛事的新浪和网易文字直播(live text commentary scripts)+对这150场比赛正式的新闻报道(gold-standard news)
数据特点:文字直播部分,单场比赛平均242句,计4590字;正规新闻部分,单场比赛平均32句,1185字
实验过程:该问题是一个有监督学习的过程,文字直播部分作为训练集和测试集的输入,输入特征向量x是人工设定的若干维数值,用于对每一句话的向量表示,标签y由正规新闻产生。所以由此训练出一个learning to rank模型,可以对文字直播中的每一句话生成一个分值代表其重要性,根据分值选出一定数量的句子,再经过去冗余过程组合成一则新闻。
所以那句“失败女神朝其抛出了橄榄枝”确实是有问题的。首先,文字直播是人写的,人肯定不会写出这种句子,其次,既然AI写新闻本质上是从直播中选句子,那肯定也不会包含这句没有来由的话。
这是仅根据该论文的一点想法,也许他们在实际应用中加了一些别的方法,但目前所谓“人工智能取代编辑或者取代记者”都是新闻界的朋友自己吓自己,毕竟训练出来的智能还只是对已有材料的二次加工而已。
全部回答
  • 1楼网友:长青诗
  • 2021-11-25 22:21
看了一下这个项目团队发表在ACL2016论文,其实是一个句子选取(sentence selection)的问题,主要工作是从体育赛事的文字直播中选取重要的句子组合成一篇针对该场比赛的新闻报道。

实验数据集:150场足球赛事的新浪和网易文字直播(live text commentary scripts)+对这150场比赛正式的新闻报道(gold-standard news)
数据特点:文字直播部分,单场比赛平均242句,计4590字;正规新闻部分,单场比赛平均32句,1185字
实验过程:该问题是一个有监督学习的过程,文字直播部分作为训练集和测试集的输入,输入特征向量x是人工设定的若干维数值,用于对每一句话的向量表示,标签y由正规新闻产生。所以由此训练出一个learning to rank模型,可以对文字直播中的每一句话生成一个分值代表其重要性,根据分值选出一定数量的句子,再经过去冗余过程组合成一则新闻。

所以那句“失败女神朝其抛出了橄榄枝”确实是有问题的。首先,文字直播是人写的,人肯定不会写出这种句子,其次,既然AI写新闻本质上是从直播中选句子,那肯定也不会包含这句没有来由的话。
这是仅根据该论文的一点想法,也许他们在实际应用中加了一些别的方法,但目前所谓“人工智能取代编辑或者取代记者”都是新闻界的朋友自己吓自己,毕竟训练出来的智能还只是对已有材料的二次加工而已。
我要举报
如以上回答内容为低俗、色情、不良、暴力、侵权、涉及违法等信息,可以点下面链接进行举报!
点此我要举报以上问答信息
大家都在看
推荐资讯