关灯
护眼
字体:

第396章 我这有几千张gu你要吗(第1页)

章节目录保存书签

八月的西安,是能把人烤出油来的那种热。

不像锦城那种阴湿的蒸笼感,西安的毒日头是直接劈下来的,混著秦川平原上吹来的乾热风,把整座城市炙烤得像一块巨大的砖窑。

任少卿拎著一个鼓囊囊的黑色双肩包,从西安交大东门的公交站一路走进校园,衬衫后背湿透了大半,贴在脊梁骨上,黏糊糊的,难受得很。

他低著头,盯著脚下的花岗岩路面,脑子里反覆过今天宣讲的那三十二页ppt。

第七页的实验数据。

第七页,是整个报告的命门。

任少卿闭上眼睛,那张对比折线图像刻进脑子里一样挥不去。

他基於alexnet架构改进的卷积神经网络模型,用东拼西凑的四卡gpu伺服器跑出来的结果,在pascalvoc2012数据集上,目標检测精度比学界主流的dpm模型高出了將近十一个百分点。

十一个百分点。

在他看来,这不是一个数字。

这是一次典范转移。

他二十七岁,中科大和微软亚洲研究院联合培养的博士生。

去年从合肥到了一趟北京,跟著导师的组看完了hinton组在ilsvrc比赛上用alexnet把传统方法打得落花流水的完整论文。

他当时就坐在微软大厦十二层的组会室里,咖啡都顾不上喝,盯著屏幕上那个把所有传统方法甩开將近十个百分点的成绩,心里某个地方“咔噠”一声,被什么彻底撬开了。

那种感觉,他后来想了很久——大概类似於在一片乌压压的普通人里,突然认出了另一个同类。

然后他就扎进去了。

整整八个月,几乎把所有能腾出来的时间全部押进去。

(请记住找书就去101看书网,101??????。??????超全网站,观看最快的章节更新)

他在自己的研究方向里开了条岔路,拐进了当时连导师都半信半疑的深度学习丛林,靠著微软亚研院借给他的一小块gpu算力,把那套模型一点一点搭起来,调参,再调参,处理过擬合,再处理,换框架,换数据增强方式……

然后跑出了那个让他失眠了整整一夜的数字。

但他没法训练更大的模型。

算力不够。

微软亚研院给他划的那块算力有上限,还要跟组里其他项目排队。

他算过了,如果要把网络规模再扩大一倍、数据集再丰富三倍,按现在能用的算力,连续不间断地跑,需要將近四十七天。

他等不起。

不是技术上等不起,是赛道上等不起。

他清楚地感觉到,全球跑在这个方向上的人越来越多。

去年alexnet一出,全世界顶级实验室就像被点著了一样,一股脑儿往这边涌。

斯坦福、cmu、deepmind……这些机构手里握著的算力,是他这种人做梦都摸不到的规模。

他必须跑快一点。

所以他来了西安。

“2013年全国计算机视觉与模式识別暑期研討会”,主办方是西安交大和西工大,协办方拉了一长串,里头有两个国家级的超算中心。

这场会议在学界的分量不算最顶尖,但务实。

任少卿要的也不是顶尖,他要的是那两个超算中心的掛名负责人,以及他提前查过的、掛在西工大计算机视觉重点实验室名下的那一批国防科工委拨款的h系伺服器集群。

他的如意算盘是:论文宣讲好,跟西部这边的大拿们混个脸熟,饭桌上开口“化缘”,借一批算力用三个月。

道理上没问题。

学术圈就是这么运转的。

任少卿走进报告厅大楼,扑面而来一股凉气,把他半干不湿的衬衫一下子激透了,打了个哆嗦,稍微舒坦了点,抬头看了眼指示牌。

计算机视觉分会场,三楼报告厅b。

章节目录