按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!
顾诚好气又好笑:“你当然轻松了,累都是我在累没见过跳弗拉明戈的时候杵得跟个陀螺似的,全靠男人使劲儿帮你转。要是再沉点儿,我绝对把你摔地上。”
“知道你怜香惜玉,那我也奖励你点好处。”李莹被转得头晕,索性环住顾诚的脖子,趴在他耳边低语,“小扎应该没和你说,他最近跟辛顿教授一起鼓捣弄出了一套图片识别的软件雏形,但目前还没法商用吧。”
顾诚心中微微一凛:“有什么正事儿刚才不能说,非要跳舞的时候才来说。他跟我提到过他做出过这么个玩意儿,但是识别率太低了,需要进一步优化算法,而且至少再经过三个月的内测学习、辅以人工的数据标示,才能有点眉目。”
史上,机器学习这门学科刚刚诞生的时候,最初盯上这门学科的就是拉里佩奇和扎克伯格这俩货。前者做了谷歌的图片搜索引擎,后者做了facebook的人脸识别技术。
何况,顾诚当初跟扎克伯格打赌时候赌的“如何识别图上是不是一只猫”课题,已经带来了很大启发。扎克伯格这学期里对这个课题组织力量勐攻,取得如今这么多阶段性成果一点都不值得奇怪。
以顾诚的专业眼光,估计至少还要一年半的努力,才能勉强拿出点够商用的成果。
李莹在mit本科上的就是计算机系,算是典型的复合型人才。如今虽然不搞研发,但技术部门弄出来的成果她光看好歹还是能看懂的。至于她整体的判断,更多是基于自己数年来的摸爬滚打。
对于顾诚的武断,她并不以为意,反而坚持自己的看法:“其实我也给他泼过冷水了,说市场部门目前完全不需要这种残次品的技术,好让他不要居功自傲。但实际上我有想过,这门技术有一个更好的短期市场应用场景只不过不是在米国,而是在华夏国内,给你那个人人网用。”
顾诚眉毛一挑:“我们去那边坐一会儿,慢慢说。”
李莹毫不犹豫地拒绝了顾诚的提议:“不,我就喜欢这种状态,思路特别清晰。你敢把我放下,说不定我就想不起来了。”(未完待续。。)
第39章 剑魔方可御残剑
“小扎那个图片识别的雏形软件做出来之后,我看过内测报告,想要在一张照片上识别出人脸来,只有不到10%的成功率。要是想进一步识别这张脸是谁,就更可怜了,准确率1%都不到而且是在内测时被识别样本只有10000人的基础上。要是选项更多一些,误读率就更高了。这份测试报告,你应该在小扎的邮件里见过吧。”
李莹轻柔地跟着顾诚的节奏,渐渐有点儿弗拉明戈的意思了。嘴里说着的,却是严肃得不能再严肃的生意话题。
因为是在舞池里,双方都怕说话声音太响泄密,只能贴着耳朵说,这场景实在是很诡异。
顾诚也附耳说道:“看过,这方面我可是专业的,我估计他这套软件,至少还要半年的时间,才能把‘识别照片上某个区域是不是一张人脸’这个判断的正确率提高到30%,至于认出这张脸是谁,没两年时间想都别想。”
人脸识别技术是用机器学习解决模煳算法问题的典范,史上facebook对该项技术最早的应用场景,就是让用户在分享照片之后,一旦点击照片上的人头位置,软件就可以自动识别出这个位置是一个人头,然后形成一个方框,让用户可以往里面填写名字。
如此一来,一张有好多人合照的照片,就可以被一个个标注上合影人的名字了。
这项技术再往下发展,某些人被标注得多了,数年后就可以形成“鼠标点到照片上的某个头像上,自动跳出这个人是谁”的功能。
再往后,则是人们常见的“智能手机拍照时自动识别哪里有人脸、以便自动对焦”乃至支付宝的“刷脸识别”。
那都是第二代、第三代人脸识别技术了,比如deepid,起码再有七八年的技术积累才可能实现。
初代的人脸识别技术,在平行时空的华夏sns社区领域也有过应用人人网的个人空间里,照片也都是可以对着人脸写名字的。
但那个时空的人人网技术不太扎实,在网站衰落之前也没做到“机器看多了某张脸之后,下次另一张照片上再标注这个人时就举一反三自动标示”这种程度(facebook做到了)。
顾诚知道这些史轨迹的大概脉络,所以并没有期待扎克伯格能更逆天。
然而现在,没有被任何存量束缚形成路径依赖的李莹,却告诉他:她对这项技术的早期应用另有妙招。
“我就是这么给小扎泼冷水的,希望他能认清自己目前做出来的这个东西根本不值钱,别为这点小成就沾沾自喜”李莹说到这儿,顿了一顿拖了个长音,似乎在观察顾诚的反应,“但是,背地里我却想到了另外一条路子,一个让‘还处在残次品阶段的人脸识别算法也能得到商业化应用’的场景。”
顾诚终于觉得自己提起了点兴趣:“干脆点儿,说。”
李莹的眼神闪过一丝埋怨,似乎在怪顾诚都不赏赐她,但还是很利落地说:“我觉得,yy网目前之所以用不到这项技术,是因为在米国不存在娱乐圈选秀活动。大家在朋友圈里人脸识别,就是图一个认得准,不准就没有意义。但是在华夏,我听说你搞了一个娱乐圈的选秀活动,将来还会有更大规模的让普通粉丝投票支持之类的举动我觉得,照片的人脸识别技术,和这个活动结合起来,就有很大的操作空间。”
顾诚的表情渐渐认真起来。场内的弗拉明戈舞曲已经结束,他也不顾李莹是否反对,拉着她就回到包厢,关起门来密谈:“说说看具体怎么做。”
李莹端起酒杯,又给自己倒了一杯喝下,把剩下的想法和盘托出:“很简单,我觉得你可以推出一个‘人人热度指数’。比如百度提供的是搜索引擎服务,就有相应的百度指数,可以看哪个关键词目前最热、每个关键词搜索后有多少条搜索结果。
‘人人热度指数’,可以在人人网和那些选秀节目结合起来之后,总结出每个候选艺人目前在人人网上的被关注热度、被搜索图片的数量、频次。乃至最关键的被人在照片头像上标注名字的次数、以及其头像当前被识别的估算准确率。
我们可以开诚布公地坦言:到时候人人网的‘人脸识别算法’依然是不完善的,识别率很低。但是我们也明说这是一个会‘自我学习、自我进化’的软件,在网上被爆照爆得张数越多、各种角度脸型数据越充分、被网民标示识别频次越高的人,就越容易被识别对。
如此一来,人脸识别算法哪怕认错人,用户也不会怪我们公司,而是会认为因为自己爆照不够多、被网民标示频次不够高,所以才认不准。她们只会更努力地爆照、更努力的吸粉,更努力地拉人标注,并且以‘我在人人网上被机器认对的概率比其他网红女更高’为荣。”
顾诚眼前一亮。
妙啊!
人脸识别技术,本该以求准为奋斗目标,不准就会被用户鄙夷。
但李莹这么一来,一项原本“对了是本分,不对是失职”的技术,就变成了“对了说明你名气大、牛逼;不对也是本分,说明网上你的照片不够多、看的人不够多”的攀比游戏。
虽然人人网只是个朋友圈性质的私密社交产品,眼下还没法做微博类产品。但因为娱乐选秀节目的出现,人人网上明年肯定会有部分娱乐圈名人的账号(至少是那些为了参加选秀而主动公开个人空间的妹子们)具有一定的‘公众号’属性,可以被大众浏览关注。
这种情况下,这些所有成名机会都依赖人人网的萌妹,就会拼命在“人人热度指数”这个指标上攀比,哪怕将来《少女时代》节目不办了,这个社会热度都要很久才能消褪下去。
当然,如果是真正的、成名已久的明星,他们或许不会在乎自己在某一个网站上的“热度指数”正如后世很多投票网站为了凑热度,都喜欢搞“亚洲最美女明星”之类噱头的活动,让大家用付费短信投票。而真正投上去的前几名几乎都是刷子,因为真正牛逼的明星根本对这种活动不屑一顾。
顾诚是个冷静人,知道自己有几斤几两,还没狂妄到和弱智小白文主角那样,因为自己定一个人气指标,全社会都会为追求这个指标的高低而趋之若鹜。
但问题是,顾诚要捧的并不是已经出名的明