香港曾道免费资料
人工智能训练师: 让机器学习“通人性”
更新时间:2018-12-27

当时这份实习更多的是侧重技巧性的操作,数据标注的规矩已制定好了,实习生循序渐进实现,不太多主观能动性施展的空间,“数据标注基于供给的语料,而后你在语料上做一定的处理,它的一个很重要的规则就是统一性,所以你不能够有更多的发现性”。

她觉得“AI落地生花实在也是两年前左右的事件”。刚毕业,Shana在深圳不创造非常对口的人工智能方面的岗位,偶然的一个契机,她在友人的推荐下,前往追一科技笔试,而后正式开始了数据标注的工作,从而打进了理工科学生的领域。

Shana是北方人,在北京待了三年攻读研讨生,专业学的是语言学专业。在北京读书的时候,她曾在一家互联网巨头公司有过两段实习阅历:一段经历是做产品经理,另一段经历是做数据标注。

Shana是追一科技的人工智能练习师,她以语言学的学科背景“闯进”了人工智能范畴,从数据标注成长为人工智能训练师。在工作中,她赋予机器人“人格”,给企业客服设备了闲聊的服务功能,客户可能跟它调侃、闲聊,提升机器人写诗、做对联的技能,让它更通人道。

人工智能训练师是一个全新的职业,他们制订数据标注规则,再将数据“喂”给机器人,对其进行“调教”、始终优化,让机器人“通情理、懂人性”,更好地为人类服务。

工作后,Shana正式跨入人工智能范围,那时的她对技巧的理解还比较浅。“我只是单纯地从兴趣出发,我学的是语言学,诚然不想做老师,但我还是渴望自己的专业可能有所用。”在她看来,数据标注是给机器人供应语料,这属于机器人教导,它不是教人而是教机器人学习某个货色,这与她的专业相近,能让她发挥所长。传统语言学的研究始终处在一个不温不火的状态,但AI的突起让我感到传统语言学有了一个新发展的方向——怎么样把语言学研究的成果应用到机器人的教诲当中来。这个方向切实也是Shana最感兴致的一个点。

那时是2013年。“当时标数据标注是在NLP(自然语言处置)局部做的,算是开端接触这个行业。”与局外人认知不同,数据标注并不是理工迷信生的天下,反而是文科生发挥拳脚的舞台。Shana观察到,跟她一起实习的小错误基本上是语言学背景的同学,“因为数据标注恳求处理数据的时候比拟细心,甚至有时需要必定的语言学背景常识”。