无中生有

畅谈遐想瞎想的AI

2022-01-24

缘起

近期兄弟公司要搞个发布会,同事刚好打火机没气了向我要了个,便闲谈了个把小时。
事先知道有产品发布会,不知道是啥产品,说是AI,主要是图像识别和自然语言分析blabla。
说是本来预定的是公司级别、本地区级别的发布会,在高层领导的介入下升级成了集团的发布会;
预算由小几十万升级成了大几十万,同事的同事压力更大的了;于是精神安慰到,怕啥?高举高打,要是能带来千万级别的单子自然就不愁了。
话讲多了,就开始海阔天空、遐想瞎想起来。

图像识别

图像识别的AI处理,之前有和他聊过去年做的项目。业主本来想做到细微动作的捕捉并识别,可以简单判定某个动作是合格、不合格或优秀;说是市面上已经有相关产品,能通过四个摄像头多角度去拍照或视频录制,然后通过AI分析,就可以判定。本质上是通过多帧图分析,一个身体部位在多长时间内移动了多大位置,由此判断是否用力过猛,或过于轻柔做不到位。
图像识别在培训领域只是很小的应用,当时还提到公共场合的应用场景,比如有新闻报道过“守桥人”,也就是大江大桥上,为了防止人轻生,有人一直在巡桥。如果通过图像识别,是否就可以通过摄像头的拍摄,分析来往人员的情绪表情进而分析其意图?从而达到判定作用?再出动防护人员去保护?减轻守桥人的辛苦,提高公共安全性。

语义分析

自然语言的处理,一开始也没有啥想法,聊着聊着,脑子里突然想起,前阵子才知道的一个高科技,就是演讲稿由AI处理成自然人发声,省去念稿子的时间体力,形成音频后,再编辑进PPT的演讲成视频,一个产品介绍视频就完成了。
进而又发散到,现在各种培训视频都是没有出现真人,大都是看着PPT边录声音边翻页生成的。要是AI能语义分析,是否可以识别PPT中的关键字,结合讲演稿的关键字,自动判断什么时间点翻页,什么页面停顿多长,等等;那么一个PPT的培训视频,连视频编辑也都省了?
再由此发散到,是否AI可以进行讲书?现在很多知识付费项目,都是讲师读完书,然后按照自己的理解生成说书音频,比如《每天听本书》之类,放在得到或喜马拉雅上收费卖课程?有了AI,有了电子书,就可以语义分析提炼中心思想,再结合搜索引擎,搜索相应的故事、图片等等,自动生成培训视频或音频课程?

回归现实

目前的AI能力,只能做到3周岁的智力水平,要是能提炼中心思想,那得几岁?10来岁是要的。
看来不是AI没有地方用,而是技术暂时还不能达到。
如果AI能达到10+岁的智力,估计机器人的时代也到了。
我们的未来也就无畏了,老龄化也没那么可怕了。
老年看护机器人?帮你洗衣拖地、买菜做饭,陪你唠嗑帮你办事…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注