第258章 上菜的路上还能边走边烹饪
作者:
浙东匹夫 更新:2021-10-03 17:46 字数:4504
“宿胖的技术路线,其实是这样的:他宣传PPT里提到的‘人工智能识别视频内容,并根据用户喜好推送’,实际上完全没有做到。
杰克,不知道你注意到了没有——为什么快蹄上的视频,都会在首页上打上这么多的字呢?比如这个‘教你如何扎丸子头’,或者那个‘牙套妹,奈何美色’、‘太木人道~’。从审美的角度来说,你不觉得短视频打这么多字很丑么?”
冯见雄侃侃而谈地诱导着,力争让杰克马自己去发现。
“对啊,为什么,很丑。”杰克马果然顺着思路往下说。
冯见雄微微一笑:“因为其实宿胖跟张一鸣一样,只会识别视频的标题和文字说明。他的人工智能是识别不出视频图像的故事内容的。他只是靠读懂了文字,然后觉得这个视频是讲什么的,就把它推荐给其他‘曾经喜欢看同类文字标题或描述内容’的用户。
所以,宿胖的真相,只是跟风了张一鸣的技术路线,然后伪装成可以智能推送视频而已。目前地球上,还没有一种人工智能可以看懂视频的故事性。至少四年内不可能。”
“原来是这样……确实,目前世界上图像识别领域最强的就是谷歌,其次就是我们阿狸系,我说他们怎么让机器读懂视频内容的呢。”
这句话不是杰克马说的,而是老曾为了补救,拍的马屁。
他似乎已经忘了,就在不久前,他还信誓旦旦说“宿胖也能做到,所以你冯见雄不配要高价”呢。
不过,没人会在意这些话就是了。
杰克马也不傻,他知道下属是为了帮他砍价。
没有一个老板会处罚一个为了帮自己砍价而说谎的下属的。
冯见雄也是顶级人精,当下呵呵一笑,穷寇莫追。
他也跟着一起当头棒喝后给甜枣:“老曾总算想明白了——老马,你就这么想好了,谷歌之所以图像内容识别做得好,是因为他们要搞图片智能搜索的引擎么。
你们阿狸之所以这么投入,是因为你们要让女人去线下服装店拍了照、然后上淘宝找同款。
目前这些技术的商业变现渠道还不多。所以只有你们和谷歌这样砸钱。连你都连根毛的成果还没砸出来,宿胖这点小身板能做出个屁啊。科研是真金白银烧钱的,又不是过家家。”
这个马屁非常精妙,关键是言之有物,让杰克马听得很爽。
毕竟冯见雄夸赞的是他的战略眼光。
对于一个逼王来说,一般的马屁是听不进去的。
但如果有人能从高科技发展趋势的角度,花式论证出他战略决策的英明果决、高瞻远瞩,那杰克马简直会爽到毛孔通透。
可惜世人再无如此口才和犀利眼光。
“嗯……似乎不无道理”杰克马沉吟数息,旋即想到另一个问题,“小冯,那你又准备如何解决‘目前的人工智能还看不懂视频’这个问题呢?如果你没有独门秘诀,那也只不过是宿胖做不到、你也做不到而已。”
“我现在也做不到,但我可以在两三年内做到,而且确保比他们快至少一到两年。”冯见雄智珠在握地说。
“那描述一下你的技术蓝图。”杰克马当仁不让地问。
冯见雄也不客气:“可以,不过能让他们先回避一下么?我的计划,不是纯粹靠技术手段来解决的。而是技术不够、商业和运营来凑。所以,涉及到很多容易被‘借鉴’的创意。我必须确保自己的商业机密。”
杰克马一听,给老曾和蔡重信都使了个颜色,让他们先出去鸡尾酒。
蔡重信和老曾对视一眼,一声不吭带着人走了。
冯见雄微微一笑:“其实,我的办法,说穿了也简单——据我所知,目前谷歌公司进行的‘智能看懂视频’项目,其项目预期期限,需要5年,才能攻克全部技术难点。
但是,这5年不是‘行百里而半九十’的,而是按照一个个技术阶段分别攻克的。他们要实现的最终目标,是‘通过让人工智能算法,识别出一个视频中,哪几帧画面才是决定全篇调性、故事主题的‘主要内容/中心思想’。
然后,再通过精读识别这些帧的画面上,有多少人物、什么动作、发生了什么故事’,最后总结出‘这视频大致是在说讲怎么样一个故事’。”
冯见雄说到这里的时候,稍微停顿了一下。也观察了杰克马的接受度,又通俗解释了几个点。
他的这番理论,如果都用术语表述,可能比较晦涩。
但是,举个小学生都懂的例子,横向对比一下,就通俗了——谷歌科学家们,在调教“深度学习”型人工智能、理解人类语言文字/图像信息的时候,其实有点儿像老师给小学生上语文课。
相信小学生都记得,当年语文课的时候,老师会不厌其烦问你:这篇课文的主要内容是什么?中心思想是什么?线索是什么?
很多小学生当初肯定是内心有一万头羊驼奔腾而过:尼玛!老子知道这个课文说了啥,看懂不就好了?你问个屁的“主要内容”、“中心思想”啊!考试答错了还扣分!
但你别说,调教机器人学语文的时候,还真得严格按照“主要内容”、“中心思想”这么一步步总结下来。很多人类觉得可以靠本能绕过去、或者省略掉的步骤,机器是绕不过去的。
杰克马很快就懂了,示意他继续:“那么,然后呢?”
冯见雄继续解说:“既然知道谷歌的技术路线了,那么我们就可以推断:在实现最终极的目标之前,谷歌需要先解决‘读懂一张图里发生的故事’的问题,然后再考虑‘如何选出一个视频中最能体现中心思想的那几帧’。
那么,距离‘读懂一张图里的故事’这一步,谷歌目前差多远呢?我认为大致是三年——目前谷歌已经可以做到识别图片里是不是有一张人脸,但还没法识别这个人到底是谁、和另一张照片里的人是不是同一个。
谷歌还能识别出‘图里有没有一只猫’,但识别不出‘这只猫和刚才那只猫是否是同一只’。而大约三年之后,这些都不是问题。谷歌能做到‘从识别出图里有只猫’,到‘识别这一帧在讲什么故事’。
我们如果紧跟谷歌的步伐,结合阿狸系的图像识别研发,就算留一年余量好了。那么2016年也能搞出‘让机器读懂一帧’的商用技术。当然,这里面肯定需要与阿狸系图像识别团队的深度合作,也需要后续的投资。
而对我来说,只要做到了‘识别出一帧’,我就能‘大致读懂整个故事’,从而把谷歌需要用纯技术手段解决的问题,用运营手段给暂时绕过去。”
技术不够,运营补。
这一招,冯见雄用得屡试不爽了。
“怎么补?”杰克马的语气已经有些急切,他觉得自己完全被冯见雄天才的脑洞给折服了。
“杰克,你看过N站的视频么?看过优酷或者youtube的么?”冯见雄不公布答案,而是先反问了一句。
“都看过吧,不多。”杰克马不明所以,回答得比较谨慎。
冯见雄终于到了揭开谜底的一刻,他傲然笑道:“那不知道你有没有发现一个细节——优酷和youtube上的视频,其实都是没有‘封面’的,而我们N站的UP主,在上传视频时,已经养成了另外传一张图片作为封面的习惯了——当然,说实话,这个习惯不是UP主们自发养成的,是我让天音硬逼着UP主们养成的。
或许将来有人看到这一招有效之后,会跟风我。但是一个网站的内容提供者水平,是不可能一朝一夕提高的,用户习惯也不是一朝一夕可以改变的。优酷未来即使学了,他们的UP主在选封面方面的水平,也是远远弱于N站的……”
后世看过B站视频的人,如果同时也是优酷用户,恐怕不难发现一个现象:
在B站上,有一批恶劣的人,经常拿封面来实现“标题党”的目的。
比如,凡是MMD配布模型的初音/巡音/弱音/爱酱舞蹈动画,都会上一张暴露度特别羞耻的图片作为封面,先骗用户点进来。
然后实际上,这张图的尺度,是明显超过视频过审尺度的,属于“视频里如果真出现这样的镜头,肯定会被404”.因此用户看完全视频,都发现压根儿就没有出现封面图的镜头。
这时候,用户们就会怒吼“交封不杀!”、“可耻的播放量!”、“下作的播放量!”
唱到了甜头的B站UP主们,为了骗点击,就从此在“交封不杀”标题党的路上越走越远。
但是,这其实是B站的一个运营阴谋……嗯,或者说得好听点,策略。
因为它成功地逼着自己的UP主们,精挑细选一张最能凸显视频主题思想的图,来当封面。
相比之下,若干年后的优酷视频,虽然也开始有“封面”这个选项,而不是直接拿“非黑屏的第一帧图像直接作为默认封面”。但优酷上的封面,并没有那么精挑细选、标题党。
B站的这种差异化策略,其实就是在赌,当人工智能读图技术发展到“能看懂某一张图的主题故事”这一道门槛之上、但还没到“识别出一个视频里哪几帧最重要”程度时,这中间这段窗口期里,B站就能在“精确猜测用户对视频内容的喜好”这个领域,实现偷跑。
偷跑的原理是什么呢?
就是:机器还不懂如何选取视频中哪一帧最重要,最贴切主题。但人类知道,上传视频的作者知道。B站逼着作者把“选出代表的一帧”这个工作完成,然后人工智能算法只负责专心解读并归类这一帧。
完美实现“在技术不如谷歌的情况下,靠运营抢跑谷歌”。
冯见雄如今为N站谋划的,就是这个办法。
哥知道人工智能不能一蹴而就,但是哥知道如何把半成品的价值发挥到最大。
谷歌的技术确实比他牛逼,但谷歌太执着技术,不懂如何“板前料理”。
把菜从厨房端出来的路上,甚至摆上桌之后,还是可以继续烹饪的嘛。
又没人规定,所有菜必须100%完工才能出厨房的们,对吧?
哥烧菜是没你快,可哥玩的是日料,你玩的是法餐,所以哥照样可以上菜上得比你快。
推而广之,其实从这个角度来说,UC系的“震惊部”虽然无耻,但从发展人工智能的角度来说,震惊部的存在,跟“交封不杀”标题党一样,是“算法对抗”的培养皿。
他们可以把人性的一个个冲动,提前发掘出来,让技术宅们测试和堵漏。
杰克马目瞪狗带。
他匪夷所思地说:“这……这都行?那,那将来N站要是真被人黑成‘交封不杀’的网站,编派你的黑材料,你怎么搞定?”
“那有什么,如果真到了算法被调教好的时候,我卸磨杀驴就好了——直接说要整顿标题党,对于UP主们上传的内容与封面图无关的,封号一定时间,或者不给榜单/广告资源,以示警戒。到时候很容易就能治理的。
其实,我知道你今年还打算全资把UC科技给买了。如果你跟我合作愉快,我不吝教你如何把那些调教人工智能算法的运营擦边球……”
比如,如何调教震惊部,什么时候抓,什么时候放。什么时候对社会诚恳道歉,什么时候偷偷不把UC咨询读者当人看、而是当成小白鼠……
运用之妙,存乎一心。
“呵,呵呵……罢了,我知道为什么一辈子都没说赢你过了。”杰克马觉得自己被洗脑得如在云端,浑浑噩噩而不知其所止,“你说N站目前部分融前就值60亿美元,就60亿吧。我再投20亿,占你25%股份。不过,我还是希望你能够跟我们阿狸系,在‘舆论分发人工智能’领域,常年合作下去,我不会亏待你的。”
“马哥敞亮!20亿美元都现砸了,我当然不会让你失望。走,去喝两杯吧。”冯见雄很随和地拍拍杰克马的肩膀,跟他扣肩搭背谈笑风生地离开了休息室。
杰克马其实是有可能选择“抄袭冯见雄的创意,然后自己扶持其他同行去山寨”的。
但是,阿狸系在大文娱领域如今并无“亲儿子”级别的布局。如果这个商业秘密泄露了,那就是两家一起用了,绝对没有现在这么值钱。
杰克马是干大事的人,他当然知道投资投的是有潜力的人,而不是公司和生意。
冯见雄这个人的潜力,值得他“听了对方的创意,就直接痛快给钱”。
周天音傻傻跟在两人后面,局促得手都不知道往哪儿放了。
她今天来的时候,可是做好了“让对方占股四分之一、融15亿美元”的心理准备了。
那样的话,N站的现值也相当于45亿,跟优酷差不多了。
在周天音看来,拆过之后的N站,能卖的跟优酷一样贵,已经很知足。
但冯见雄偏偏就是脑洞一下前沿科技进展,跟杰克马聊聊天,就多聊出来了5亿美元。
“他刚才说的话,每个字大约值20万美元。”周天音在内心默默估算了一下,彻底五体投地。