阅读设置(推荐配合 快捷键[F11] 进入全屏沉浸式阅读)

设置X

第198章 超参数(1 / 3)

李渡放下电话对鹿漫说:“身份证给我。”

鹿漫听话的从自己小包中拿出身份证,将身份证递给李渡。

“130130XXXXXXXXXX”

挂完点电话后,李渡将身份证还给鹿漫,笑着说:“一个半小时后的飞机,早点回去好好休息,祝你明天试戏顺利。”

鹿漫重重的点了点头:“嗯。”

接下来的一段时间,李渡一直和沈知意还有她的研发团队在一起,知深科技被收编的这一半公司名字也审批通过了一兵器集团800分公司。

李渡本来还纳闷为什么给他们定的是这个编号,因为整个集团总共也就十几个分公司,经过沈知意的提醒他才知道,这是终结者第一部机器人的型号。

看来上面的人也许并不是这么死板,偶尔还有点小情趣。

经过一段时间的摸索,李渡已经总结出了经验,他的情报系统虽然表现出了一定的随机性,但是也和他每天的具体工作有一定的关联性。

所以他天天和研发人员泡在一起,尽量让自己能跟的上他们的节奏,知道他们每天工作的目的是什么,难点是什么,果不其然,隔三岔五的情报总能为他提供一些对研发有用的信息。

有时候是一些关键技术路线的抉择,有时候是某个特殊环节的疏漏。

刚开始大家只是觉得又来了一个外行指导内行的领导,尤其是刚刚调过来在体制内工作过的那一批人,对这种事儿已经见不怪了,只能硬着头皮分出一部分资源去验证李渡的猜想。

结果几番实验下来,结果出乎大家的意料,就连专门从总部调来的头发有些斑白的首席架构师都感叹道:“这世上真的有靠直觉解决问题的人吗?”

为了进一步发展挖掘李渡的潜力,他每天拉着李渡一起搞研究,还不吝啬自己的时间,专门抽空为李渡教一些基本的知识。

李渡害怕露馅,只能装出一副好逸恶劳的样子,拒绝学习,气的老头指着李渡的鼻子大骂:“你这么浪费你的天赋,是对国家的不负责任,是对人类文明的不负责,你本来可以成为海森堡那种留名青史的大科学家的,虽然你现在没有基础,但是从头再学也不晚。”

对此李渡只能选择敬而远之,一副死猪不怕开水的样子,让老不得不放弃。

老头说的海森堡他也知道,为了研究量子力学,这位大佬随手创造出一个数学工具,就是现在大学的一门数学学科线性代数。

情报系统目前提供的情报的信息密度还没有这么大,所以李渡还是不要碰瓷那些大佬为好,安安稳稳做自己的亿万富豪就可以了,搞科研,自己就不是那块料。

今天是公司基于新的模型架构研发出的人工智能问世的日子,当然,目前而言,所谓的人工智能还是个人工智障,接来下它需要借助超级计算机进行不断的迭代,进化,才能具有真正的使用价值。而取决于迭代速度的就是模型的超参数设置,不同的超参数的对迭代速度的影响差距高达上千倍,也就是说如果参数设置不好,很有可能几个月就能完成的工作,一个搞不好就得十几年。

目前而言,超参数的设置业界已经有很多研究和理论,虽然都有一定的指导意义,但是不多,实际工程应用还是靠玄学,靠经验,花费大量的时间和经验慢慢去试。

至于什么时候就算是调整到完美状态,也没有什么好的评判标准,纯靠人的主观认知去确认是否把参数调到了最佳状态。

超参数到底是什么东西李渡也试图弄懂过,技术人员给他讲了很久,一顿权重衰减、L2正则化、左右学习率等专业术语搅得李渡脑子一片浆糊。

他现在也就对基本概念有了认知,这么高端的理论对他还是有些难了,不过这一切都不重要,他只需要明白超参数每个参数的表现形式就够了,别出现主=6这种搞笑的错误就可以了。

看着沈知意带着一群人,在讨论方案,李渡一个人随便找了一个沙发坐下。

【我要使用定向情报。】

【请告诉我兵器集团800分公司正在研发的神经网络模型超参数的最佳设置是什么?】

李渡第一次见系统情报刷新的这么慢,可能系统也没有想到有人用他来搞科研,经过了足足半个小时,系统才给出了答案。

【Adam(0. 9,0.999)

lr:1e-4sch:warmup10k, lineardecayto0

bs:128k=256512i

ts:1M (40e)

L2:0.01

dropout:0.1】

没有任何解释说明,只是一串字母,不过这对李渡来说就够了。

李渡将数组牢牢记住,走到了讨论的人群中间。

“要不让我来试试?“

负责模型调参的项目组组长看到李渡又要来掺合,一脸为难道:“李董,超参数是一个复杂的数组,您就算是靠着运气蒙对一两个数据对,其他数据不合适,也没有任何意义啊。”

首席架构师看到李渡顿时一顾气就上来了,瞪着眼睛道:“让他试,我倒要看看这种不学

上一章 目录 +书签 下一页