Seed校招博士自述:我为什么选择来字节做大模型

2024-11-08 12:17:39 来源:

原文来自知乎博主张逸霄对“大家能分享一下当前博士就业的情况吗”的回答。

人在*,刚过答辩。今年拿了腾讯 AI Lab(青云计划)、字节跳动(Seed) ,国外有之前实*的 Sony 和 的 offer,国外也有正在面试的 Adobe 和 Meta。这些工作机会的方向都和我的博士工作完全 match,没有转方向的痛苦。

最后,我接了字节 Seed(豆包大模型)团队的 offer,结束秋招。

背景介绍

我是一个方向比较独特的博士,做的是音乐生成。今年年底四年顺利毕业,最后的选择是:接了字节 Seed 的 offer,在工业界继续进行研究。

张逸霄主页:

逛知乎的这个方向的同行们应该多少读过我在知乎写的鸟瞰 ISMIR 知乎专栏系列。和很多人一样,我是从其他方向转来计算机音乐方向的,早年我边看边学,留下了一些笔记,现在还挂在知乎里有人不时点赞。

人工智能可以作曲吗?1141 赞同・116 评论 回答

如何看待中央音乐学院首招音乐人工智能方向博士生?更广泛来说人工智能在音乐领域的应用与前景?1083 赞同・88 评论 回答

虽然 AIGC 火起来的这两年,看上去音乐生成已经成为一片红海,但我入行的时候并不是这个样子的。甚至我之所以出国读博,是因为国内只有屈指可数的两三个老师有计划培养这个方向的博士(当然现在国内稍微多了一些,央音、上交、港中深等一些学校都开始招收 phd 和工作岗位)。

我在读博的时候,认真考虑过自己博士毕业之后会不会没饭吃,会不会被迫转行。确实是一个扎扎实实的穷方向。大部分人都是在为爱发电,扎扎实实将自己的博士四年投入到音乐方面的各种研究之中。

但是这两年大模型和 GenAI 的风一吹,音乐生成方向突然又行了。我算是一个比较幸运的学生,在行业的 bar 不高的时候入行,在市场壮大之际毕业。

找工作过程中,其实有很多感慨。

1. 找工作是一个长久的过程。很多时候,在读博期间建立的 能很大程度上帮助我拿到面试,找到工作。在我秋招的过程中,给我面试的公司,无一例外都是之前建立过联系的同行。我在找工作的时候,能把简历直接递给 之后,整个流程都很顺利。

2.一个领域的工作机会,很多时候更大的决定因素并不仅仅是个人努力。我 2019 年的时候还在做音乐结构分析,而 2023 年之前,计算机音乐方向都是不温不火的方向。现在生成方向搭上了 GenAI 的快车,让更多同行能拿到高薪,但这和他们的选择并没有什么关系;一个公司有没有给 offer,很多时候更可能是很多其他因素导致了这个结果。

这个时候,有一句勉励的话可以恰如其分地用在这里:

世界上没有快乐或痛苦;只有一种状况与另一种状况的比较,只是如此而已。只有曾身受过最深切的悲哀的人,才最能体会最大的快乐。摩莱尔,我们必须经验过死的痛苦,才能体会到生的快乐。所以,我心爱的孩子呀,享受生命的快乐吧!永远不要忘记,在上帝揭露人的未来以前,人类的一切智慧是包含在这四个字里面的:“等待” 和 “希望”。

确实是这样的。

煎熬的毕业前半年

毕业的前半年无疑是煎熬的。因为从这个时候开始,全职的 offer 就可以开始陆续谈下来了 。

我在*玛丽女王大学 (Queen Mary of , QMUL) 的数字音乐中心 ( for Music, C4DM) 读的 phd 。实验室近几年保持着 70 余位研究计算机音乐的 phd 学生,从规模上应该是全世界最大的计算机音乐实验室。

这个 phd 与一般的* phd 的差别在于:*传统上是三年制,而我的 phd 是四年制,第四年结束之后可以提交学位论文,这个阶段最长可以有一年。我们称这个阶段为 “-up” 阶段。这就使得我接受的 像是一个半英半美的结合体。

UKRI for in and Music

我本科毕业之后没有直接读博,而是 gap 了一年之后申请了 phd。在第一年经历了上课的过渡期之后,我在博二博三期间的产出其实并不算多,加上实验经历并不如同学们那么充分,于是我经历了长达一年的可怕阶段:做什么实验,什么实验 fail。我又是一个科研自尊心很强的人,博三结束之后,我焦虑地整夜整夜睡不着觉。

事实上,那是光明之前的最后黑暗,因为构成我毕业论文的主要的三篇论文,都是在我博三结束到博四期间构思完成的论文。

那个时候要撑过来,其实很感谢我的博导 Prof. Simon Dixon。用我们实验室的话来说,他的风格有点像 big daddy,温暖呵护每一个博士生。虽然他有点上年龄了,不是总能跟得上科研前沿,但他有三个优点:我想做什么,他都支持我去做;他总是正确地指出我科研不成熟的地方,从 idea 完善,到实验设计,到论文写作。把我摆正之后,他又开始放羊。

毕业前半年,我又开始焦虑。我是一个很容易被影响的人,我时不时会有严重的 peer ,甚至会时常压迫到自己半夜失眠。这一部分也是因为,不管我博士期间做得如何,我都要上就业市场,面对残酷而不公平的博士竞争了。

作为一个合格的 INTP,我开始做广泛的调研,然后得到了下面的信息。

MIR 领域的毕业选择:高校还是工业界?

尽管我们领域这么冷门,但博士毕业之后的主流出路仍然是两个:高校或是业界。

事实上,我在就读博士期间,对这个选择一直保持 open 的态度。

学术界的选择

学术界来说,目前高校仍然是一个比较卷的选择。可以参考今年大学放出来的名额:

我没有去学术界的原因有两个:

1. 大模型时代,工业界资源更为丰富 。

这一点想必同行们都深有感触。现在需要训练一个参数量比较大的模型,学校实验室的那一点显卡根本是不够用的。如果有机会去公司实*,有足够的 A100,H800 可以用,那么很多 idea 才有实现的可能。

我认为未来几年里,工业界和学术界的差距可能会进一步增大。这使得在学术界的产出可能会受到经费的影响,难以做出跟进前沿的工作。

2. 大团队作战的工业界实质上领先于学术界 。

这一点也可以从这两年大模型的突破性工作的比例看出来。最具代表性的工作,基本出自 Meta, 这些公司的团队作品,这一点音乐方向也是差不多的。

换而言之,如果要上大模型的战车,那么工业界是一个更加实际的选择。

工业界的选择

来看一下目前涉及音乐业务的工业界版图:

大厂:

中小厂:

非 AI 公司:

  • 标签:
相关阅读
热门标签