
若是把东谈主的大脑比作一台蓄意机,那么北京大学蓄意机学院杨仝敦朴的大脑似乎总在运行一个名为科研的重要。不管是日常通勤、饮食休息,仍是睡梦中,他齐陆续想考着科学琢磨的前沿难题。
这种近乎本能的想考景象,来自于他一齐走来的科研轨迹。学生时间的杨仝,是很多东谈主眼中的“天才少年”——用三年在清华拿到博士学位,在中国科学院蓄意统统这个词观看一年,之后便来到北大络续科研之路。
连年来,杨仝率领团队发表CCFA类论文100多篇,与华为、小米、360、开物等多家企业张开合作,并设置了三个琢磨实验室,持续推动琢磨效果更正为治理实质问题的有用器用。在与华为的合作中,已累计6次取得华为“难题揭榜”火花奖。
行动北大数据结构实验室的崇敬东谈主,杨仝率领团队在2018年发表北大首篇SIGCOMM顶会论文,2025年提议全球首个复数基座大模子和首个复域变换措施(实数大模子与复数大模子双向等价转机)。数年期间内,屡次诈欺经典数学表面,兑现独具表面好意思感的算法革命与落地,举例费马小定理+Sketch、四色定理+过滤器......
杨仝的科研团队也在陆续招揽着一批批优秀同学加入,其中不乏拿国外竞赛金牌的同学。实验室里进取的代码和公式,搭载大模子活泼移动的机器东谈主,齐是这支陆续壮大的团队用AI本事孝顺社会、服务民生国计的生动图章。

北大PKU-DS实验室的学生

杨仝(左)指导实验室学生调试搭载大模子的机器东谈主
01大路至简
-给大模子作念“减法”-
连年来,AI大模子赶紧发展,但其部署仍面对“本钱高、功耗大”的瓶颈。要想缩小部署空间与用度,推动大模子在手机、机器东谈主等结尾开采上普及诈欺,发展高效的轻量化决策已成为关键需求。这也恰是杨仝团队全力攻克的本事痛点。
团队率先在实数轴上反复尝试,微软的决策是0和±1,看似合理,却销耗了25%的空间;换成±1、±2,实验效果又大打扣头。实数轴上想找4个对称、合理又高效的点,压根作念不到。
面对难题,杨仝的想索停不下来。在一次开车通勤时,一个灵感在他的脑海中闪过:“横坐标加纵坐标,不就有自然竣工的四个点吗?+1、-1、+i、-i,取±1的时候,虚部是0,取±i的时候,实部是0,对称又纯粹。矩阵乘法还简化成了实部和虚部的加法,莫得比这更梦想的组合了!”这个发现让他茂盛不已。
但灵感也仅仅启动,落地的路上密布禁绝:复数大模子是全新场所,范围内莫得任何可模仿的教唆。十月份意象的idea,到来年三月份才拿到算力。启动预教练时,90%以上齐以失败告终,上流的租卡本钱也带来雄壮的压力,有时团队以致以为相持不下去。蓄意机学院院长胡振江敦朴曾饱读吹后生学者“要作念第一且惟一的琢磨”。大模子范围“第一且惟一”的场所少之又少,而复数大模子恰是这样的革命,这让团队的决心耐久弥坚。
除此除外,救助他们熬过反复失败的,是对复数模子的第一性直观——“模子的数学结构自己很漂亮,况且自然界中大量信号天生等于复数形态,有模长、有辐角,这种贴合自然的联想,没原理作念不行。”经过不懈奋勉,杨仝团队提议的新决策最终落地,推出Fairy系列大模子,用复数将矩阵乘法十足放置,更正为能耗低一个数目级的加法。这种底层本事革命,源于杨仝对数学好意思感“大路至简”的执着追求。
《蓄意机琢磨与发展》主编徐志伟敦朴驳斥复数模子的论文:妙在展示了团队的数学知悉、表面革命、本事缓和。他们剿袭了从黎曼到彭罗斯的理智:复数有其独有的奇妙。

杨仝训诫iFary合座架构
掀开北京大学APP,“大模子教练场”一栏的FairyR1-32B-Preview模子,就出自杨仝团队之手。FairyR1模子通过将参数目精简至DeepSeek-R1671B满血版的5%,兑现极致轻量化的同期,保持了极高性能,最终在数学与代码才智上超越DeepSeek-R1满血版。
值得一提的是,在FairyR1除外,杨仝团队在“大模子作念减法”方朝上还有两项代表性工作:iFairy探索复数域原生建模与极限量化下的性能上界,Fairy2i则聚焦已有模子的低本钱迁徙与高效部署。两条阶梯从不同场所鼓励并吞件事——让大模子更轻、更省,同期尽可能保持高性能。
这个给大模子作念减法的流程,稳健蓄意机的发展轨迹,开元棋牌官网从占满几个房间的巨型机,到如今好像被每个东谈主抓在手心的手机,开采越来越小,也越来越普及。
“大模子势必会走一样的路”,杨仝说,“从云表冉冉下千里到企业局域网、条记本,最终的看法是让大模子装奏凯机这样的微型结尾里,或者按需部署到机器东谈主、机器狗身上。”
更寥落的是,杨仝团队将iFairy和Fairy2i代码、数据和模子全部开源,让更多东谈主能参与进来,络续探索这份“数学好意思感”背后的可能。
02顶天随即
-“既仰望星空发表论文,也实事求是算法落地”-
“高技术应作念到‘顶天随即’。”是王选先生一世清翠的信条。“顶天”即陆续追求本事上的新缓和,“随即”即把本事商品化,并大量实行、诈欺,而“顶天”是为了更好地“随即”。
杨仝科研之路的启动并不随手。2015年,他来到北京大学作念助理琢磨员,转向集合测量这个新范围,伊始的几年论文果然全部被拒。那时实验室里的学生齐是年级里名列三甲的杰出人物,可新范围的目生感、论文屡投屡拒的挫败感,让杨仝不免惦念:这些优秀的学生会不会因为看不到效果而离开?
让他喜跃的是,这群学生采用了信守,以致常驻实验室潜心钻研。终于,2018年,历经半年构想和撰写,杨仝团队告捷发表了北京大学首篇SIGCOMM论文ElasticSketch。SIGCOMM是蓄意机集合范围公认的顶会,“零的缓和”重量可想而知。
这篇破局之作中,最关键的缓和源自睡梦中的灵感。“那时倏得意象,分流之后不错作念一次压缩,按理说压缩会让精度变差,但若是和奏凯构建的铁心对比,精度反而能提高,给东谈主一种‘越压越准’的嗅觉。”
一次次看似有时的想维火花,源于长久的辛勤想索,更源于对科研发自内心的爱重。他刚起床就坐窝给学生周洋打去电话,米兰体育app官网迫不足待地共享这个想路。
最终,ElasticSketch通过精巧的压缩联想,加快的同期不仅没缩小性能,反而兑现了反超。比拟那时的主流决策,Elasticsketch的处理速率提高44.6~45.2倍,失实率缩小2.0~273.7倍,还能适配P4、FPGA、GPU等六大平台,完成六种典型测量任务。
这成为杨仝“顶天”之路的坚实一步,也掀开了与华为“随即”合作的大门。华为南京邀请他参加“集合寰宇论坛”作念陈说,陈说结尾后,华为的郑晓龙博士主动找上门,提议将论文中的新算法诈欺到实质名目中。不久之后,算法落地到华为芯片出产中。
与华为的合作一直持续了八年,杨仝浮现,自从首个算法镶嵌芯片,他与华为合作越来越顺,并6次取得华为火花奖。通盘合作名目中,80%齐被评为优秀,而华为名看法优秀率平方不到10%。
六次火花奖
2023年
在珠峰会战难题“IPv6数据面查找算法”中提议缩小片内内存的高价值决策
2023年
在高性能难题“基于微流的高性能转发调换模子”中提议高价值决策
2023年
在珠峰会战难题“[自动驾驶集合]资源敛迹下百万数据流统计/筛选算法”中提议高价值决策
2024年
在华为云难题“[集合测量]面向海量确凿业务流的软硬协同测量本事”中提议了高价值的架构与算法
2024年
在算力会战难题“MOE教练的动态众人负载瞻望本事”中提议高价值决策
2025年
在珠峰会战难题“网算协同保举系统卸载算法”中提议了高价值算法
近期杨仝团队提议AgentRob框架,买通了LLM智能体落地物理世界的新旅途。该框架兑当今线论坛、LLM智能体与物理机器东谈主三方相识,用户只需在论坛中@机器东谈主,即可奏凯调换实践中的机器狗、东谈主形机器东谈主完成任务。它将智能体与机器东谈主的交互融入东谈主类可读的社会语境,有用考据了社区驱动式机器东谈主合营的可行性。(论文地址:https://arxiv.org/abs/2602.13591开源代码GitHub:https://github.com/PKULab1806/AgentRob)
连年来,杨仝团队发表CCFA类论文100多篇,和小米、360、开物等多家企业均有合作,并设置了3个琢磨实验室,相持把琢磨效果更正为治理实质问题的有用器用。从科研“顶天”到诈欺“随即”,印证了“科研既要仰望星空,更要实事求是”的初心。
{jz:field.toptypename/}03师门传承
-“咱们实验室莫得改不好的bug”-
学生时间,杨仝是原原本本的“天才少年”,曾在天下蓄意机专科顶尖的三个地方念书和工作:在清华读博,用三年拿到学位;在中国科学院蓄意所作念一年琢磨后,来到北大踏上琢磨员之路。
如今,杨仝的实验室蕴蓄了更多“天才少年”,累计有百余名布景相反的学生。这里年事最小的学生仅17岁,有IMO、IOI、IBO等多项国外竞赛金牌得主,还有高二就拿金牌、通过预科提前干预北大的少年班学子。
管制高密度的天才可谓是千古难题。而在杨仝的实验室里,这群顶尖学子相互碰撞磨合,却迸发突出妙的化学反馈。杨仝笑着说,群众总以为蓄意机学生偏内向,不爱语言。而实质上,实验室里的学生分红两类,一类善于抒发,一类千里默肃静。他们总能互补着变成“搭子”,让实验室氛围既活跃又厚实,百家争鸣的同期好像矢力齐心。

有期间就和学生饭堂约饭,面对面调换
在杨仝的指挥下,实验室有如一个一家无二的群众庭。学生们字据琢磨场所分组合作,学生行动名目本事崇敬东谈主与他高效对接纳事。而杨仝我方则更像一个群众长,实验室百余名学生之众,他仍能和每一位学生依期调换。为此,他果然每天齐与同学们一齐约饭,了解每一位学生的现状。让他喜跃的是,学生们不仅成为科研伙伴,私行里也亲如家东谈主,频繁约会、出游,偶尔还会相互借住。遭受穷苦永远有东谈主宥恕赞理,谁的代码卡了壳,其他同学齐会主动赞理debug,即使忙到夜深也从未衔恨。杨仝细目地说,“咱们实验室从来莫得修不好的bug”。
有事一齐扛、有难一齐解,这份解析让这个蕴蓄“天才少年”的团队,不仅有顶尖的科研实力,更有令东谈主感到温和的凝华力,在探索未知的谈路上稳步前行。
“自然莫得硬性捕快,但看果然验室里这样多顶级学生,你会以为不作念点大事,齐抱歉他们的天禀”。这份工作感推着他陆续追求开创、追求极致。

杨仝与学生究诘问题
生存中,他恒久保持着法例的作息,每天7点准时起床,早早抵达学校。实验室的黎明格外欢然,正稳健千里淀想考。稍晚的时候,种种名目会议、团队究诘会陆续启动,排满一整天,直到夜深才能告一段落。就在采访前一晚,杨仝还在和团队究诘何如使用GPU加快数据库查询。在贫寒的工作之余,杨仝相持健身、打乒乓球,保持头脑廓清。
对他而言,科研从不是职守,而是拥抱心底的爱重。每一次灵感迸发、发表论文、获受奖项,那种探索未至之境的享受,是任何东西齐无法替代的。杨仝说,中国高下几千年,科技高速发展却只须最近几十年,年青东谈主出身在最佳的时间,亦然最能作念出最大孝顺的时间。他以为,这代年青东谈主领有前所未有的机遇,只须爱戴时光、奴婢爱重,就有可能为行业进步、社会发展、民生国计孝顺巨猖厥量。
东谈主物简介
杨仝,北京大学PKU-DS实验室崇敬东谈主,北京大学蓄意机学院琢磨员、长聘副教训,北京大学东谈主工智能琢磨院琢磨员,耕作部后生长江学者,北大-小米大模子琢磨实验室主任,北大-360大模子琢磨实验室主任,北大-开物金如意东谈主工智能琢磨实验室主任,北大临港-九章云极大模子琢磨实验室主任,北大临港大模子研发中心主任。主要琢磨场所为大语言模子关键本事与概率数据结构。实验室云集了迢遥优秀本硕博学生100余东谈主,包括IMO、IOI、IBO、IPHO、NOI、CMO、CNBO、CChO金牌。连年发表一作/通讯作家CCFA类论文100+篇。提议首个复数大模子iFairy和复域变换Fairy2i,兑现了2比特的量化精度高出了量化前16比特实数大模子。课题组研发的FairyR1模子以5%参数超越DeepSeek满血版R1的数学和代码性能,已在北大校园网提供大模子服务。取得中国电子学会本事进步一等奖(排行第二)、6次取得华为火花奖(天下最多),1次奥林帕斯前锋奖。琢磨效果取得了国度自然科学基金委员会网站4次报谈、耕作部科技发展中心1次。
彩蛋
365建站客服QQ:800083652复数大模子iFairy和Fairy2i开源地址
这是杨仝敦朴团队开发的大模子开源地址。包括iFairy、Fairy2i的模子、代码和平台进口。想进一步了解大模子的读者不妨探索一下!
iFairy
Fairy2i
开首|北京大学融媒体中心、北京大学科技开发部
采写|骆锦锦、张矣可
图片|朱成轩
排版|唐儒雅

备案号: