音频文字发布在公众号“北京读天下”,《价值创造与商业模式》在公众号微店有优惠。反馈与服务微信号:yinmingshu002。
只要有上网条件,就可以免费学习一门语言,多邻国如何利用众包机制支持创业?游戏化学习机制和AB测试在语言学习中可以有怎样的应用?
在创建多邻国之前,冯·安教授已经是一名著名的工程师和创业者。每位上网者都曾经使用过他在2003年开发的一项产品,验证码(CAPTCHA)。验证码可以用于帮助网站区分真人和程序登录。冯·安将这项发明免费提供给商业网站如雅虎等使用,每天大约有2亿次使用。他注意到,如果每位用户花在输入验证码上的时间为10秒钟,全球用户一天就要50万个小时。这样大的劳动量白白浪费有点太可惜了,有没有什么办法将这部分工作转化为市场价值?
众包的力量是惊人的,虽然每位用户每次只花10秒钟,但reCAPTCHA每天可以识别的单词数量多达1000万个,这是一项有商业价值的服务。最早联系冯·安教授的是《纽约时报》,请他帮助报社将长达一个多世纪积累下来的众多文献进行数字化识别。
2009年,Google收购了reCAPTCHA。收购后,Google扩大了reCAPTCHA的应用范围,不仅用它来识别扫描图书,还用于识别Google街景照片中机器无法识别的文字。reCAPTCHA的另一项应用是帮助人工智能进行标注,提高人工智能的识别能力。
reCAPTCHA的设计方案通过大规模众包解决了收入问题,这也成为冯·安创建多邻国时所采用的基本原则。它的设计理念是,向全体用户提供免费的、无广告的语言学习工具,用户在学习过程中以众包方式帮助网站产生收入。
2011年上线时,多邻国的登录页面上写着:“学习语言,翻译网页。” (With Duolingo you learn a languagefor free, and simultaneously translate the Web.)用户在学习过程中要做一些翻译练习,这些翻译练习有价值潜力。市场上存在着免费学习语言的需求和网页内容翻译的需求,多邻国的商业模式是将这两大市场需求对应起来。
网站将需要翻译的内容交给用户作为翻译练习材料,通常是由学习某一语言的用户将外语文件翻译为母语。为了保证翻译质量,由翻译社区对译文进行投票,选出最好的表达。随着用户学习成绩越来越好,分配给他们的翻译工作难度也相应提高。
冯·安测试了不同的验证码方案,发现人类可以识别一些模糊的字母图形,而机器却缺乏这种能力。当时,像Google等公司正在进行历史文献的数字化,需要扫描大量文献,如图书和各类历史文件。其中经常会遇到由于字迹不清导致扫描软件无法识别的情况,然而这些内容人类却可以轻易地识别。
基于这一发现,冯·安在2007年开发出新的验证码方案,称为reCAPTCHA。用户所看到的图像来自旧书和报纸里面的单词,输入这些单词可以在验证身份的同时帮助解决文件扫描中遇到的问题。冯·安的这项设计将填写验证码变成了一项众包工作,大规模文献图像识别。
Create your
podcast in
minutes
It is Free