关灯
护眼
字体:

第11章 茶里茶气的梁舒瑶(第1页)

章节目录保存书签

“第二,素材预处理,用户导入视频素材后,后台同步进行分析,分析完成前先提供基础剪辑功能。”

“最后,也是最简单的,降低预成片的解析度,1080p渲染慢就720p,还不行就先上480p。”

“先解决有无问题,后续版本更新中再想办法优化。”

“好,老板我明白了。”有了初步解决方案,罗浩心里就有底了。

等罗浩离开,陈宇继续思考“语音转字幕”的准確率和同步性问题。

他希望软体能自动识別视频中的语音,並生成带时间轴的字幕轨道。

这个剪辑功能在后世司空见惯。

但在15年,国內可用的语音识別api收费昂贵且准確率堪忧。

这一难题只能通过开发新技术解决。

他测试过讯飞和度娘的语音识別sdk,中文普通话的识別率能达到90%以上,但需要联网,而且有並发限制。

如果用户量大,api调用成本会高得无法承受,导致利润都被赚走,让瀚宇科技为別人打工。

这是陈宇无法接受的。

所以他必须自研语音识別技术,重点是字幕和视频画面的同步要精准,误差不能超过0。2秒。

这个数字很微妙。

多了就会让用户明显感觉到卡顿,少了的话,技术实现难度將呈指数级上升。

显然这又是一个需要肝的技术难点。

考虑到目前的智商暂时够用,陈宇最近都把系统每天签到获得的赋能点,用来增强体能。

有一个健康的好身体才有足够的精力肝项目进度。

甚至陈宇內心深处有时还会憧憬。

当体能被赋能得足够高,最终突破人类极限,那么。。。会不会增加自己的寿命?

为了搞清楚这项伟大的寿命延长实验可能性,他打算以身试法。

嗯,就酱!

。。。。。。

2015年,5月23日。

经过两个月磨合,瀚宇科技已经走上正轨,智剪项目的开发进度达到80%。

剩下的就是让开发工程师继续优化,部署测试alpha版本,寻找bug。

这些工作都可以交给项目组搞定。

陈宇这个亲临一线的大老板总算可以脱离繁重的代码研发工作,好好享受享受生活了。

章节目录