1.2 Career
职业规划:¶
职业规划是成为 AI系统的性能分析建模分析 -> 理解AI算法数学本质, 设计爆款AI算法应用:
- 测量各组件指标,
- HPCG,HPC, AI benchmark
- 分析理解应用瓶颈
计算机职业规划¶
- 自底向上分析理解和设计计算系统(系统建模与高层次的抽象) + 企业核心落地应用
- 融入公司的核心竞争力的发展。参与到低延迟,高并发的高性能系统的设计。(使用、理解、设计)
- 传统应用的优化入手,分析计算系统的上限和程序的性能释放瓶颈,从而了解系统瓶颈。并考虑上异构的系统或者FPGA来解决。
以性能优化为切入点,系统建模和分析数据流程之后,解析程序瓶颈(深入了解对应操作系统是如何调度实现的,来深入了解内核),探寻性能最佳的执行手段。
具体职位的转变¶
- 百度/华为AI系统(软件性能工程师) -> 应用在GPU上的适配的瓶颈 -> AI系统架构师 -> AGI系统架构师
- 阿里云 HPC组(深度学习虚拟化技术) -> mihoyo 的 云游戏部门
- 需要调研云游戏现状
- 互联网 -> 30岁考公回长沙
公司分析¶
候选公司¶
- 一线互联网BAT: 百度, 阿里, 腾讯, 字节
- 华为
- 美团,快手
- 新兴明星公司:mihoyo,小红书
甄别技巧¶
- 真想招聘人的公司,是能感受到那种诚意的,是站在用人的角度去考虑问题,基本问一些相关的情况。差不多能用就发offer了。3
- 有些公司明显就不想招人,不仅问的是否详细,内容也十分偏。折腾半天,最后也不了了之了。
- 除此之外有些公司只是为了解决自己的问题,面试是能感知到一些东西的,遇到明显套方案的公司,不要什么都说,要有所保留。
就业指导¶
- 选行业:关注国家政策,关注社会趋势
- 选平台:第一梯队,如果可能只要首位
- 选团队:选主不选辅,技术厚度,慎选小Team
- 选上级:经验,口碑,性格特点,梯队历史
- 看待遇:长期发展,短期收益,PK offer
指标一:大厂与国家的科研布局¶
华为遥遥领先,基础研发有待加强4
指标二:计算机相关的国内500强¶
普联是制造业的500强(1),和讯飞暂时还无法进入民营500强1
- 2023年制造业500强也找不到了
案例实践:2023秋招 华为 vs 百度¶
- 华为 - 昇腾产品线 - 昇腾计算开发使能部 - 软件开发工程师
- 百度 - TPG基础计算体系 - DLTP深度学习技术平台部 - 飞桨引擎异构部门 - 异构计算工程师
比较项 | 华为 | 百度 | 百度相较于华为 |
---|---|---|---|
公司影响力 | 爱国色彩,消费者认知 | 对于消费者还停留在搜索引擎 | -1 |
变现渠道 | 结合终端产品和自身的服务器产品,AI能很好落地 | 卷AI模型软件网络服务,落地到AI百度搜索/智能云2,硬件基础和销售弱一些 | -1.5 |
发展机遇 | 新部门开拓期,杭州和青浦定位相同,可选范围广 | 百度的核心AI业务的核心引擎部门 | 0 |
定级/晋升难易 | 特批的16级 | T4 | +0.5 |
部门团队 | 200人大部门 | 20人,较小独立的精致团队,便于团队内交流, 和领导也聊得来 | +1 |
师兄帮助 | 有同届的spq,还有lh师兄等师兄 | 唯一zpq师兄,还是在独立的昆仑芯 | -1 |
工作学习内容 | 华为摸索期,会有基础琐碎业务,参与到下一代昇腾, MindSpore(2020年3月)的研究 | 百度走在国内前沿, 学习了解飞桨平台(2016年8月底) | -1 |
毁约影响 | 没谈成之后也可以跳过来 | 毁约后很难再来 | +2 |
跳槽难度 | 不是传统互联网节奏 | 更适合在互联网企业流转 | +0.5 |
工作强度/节奏 | 8点半9点走,月末周六加班 | 七八点走 | +1 |
买房压力 | 青浦房价低,但是不适合定居 | 浦东房价高 | -1 |
生活通勤成本 | 便宜单人宿舍,应该离工作地点近, 食堂应该不错 | 住房成本和环境确实高一些 (+住房2k/month) | -1.5 |
周围配套(娱乐生活) | 偏远上海青浦,距陆家嘴/高铁站(2h+/1.5h) | 上海浦东,距陆家嘴/高铁站(42mins/1.25h) | +1 |
稳定性 | 两年较稳定期 | 全靠自己实力 | -1 |
工资 | 特批之后是同薪资(但基础工资的公积金差7% -3k) | 高薪 (n)*16 | +1 |
综合 | 专心的奋斗者,致敬 + 更长远的布局和共同成长 | 工作和快乐生活更平衡 + 接触工业界的前沿知识 | -0.5 |
工作内容:华为 昇腾计算开发使能部
- 调优体系工具Nsight(算子,网络训练分析
- 训练优化,精度提升(内存优化, 千卡万卡调度,通讯库
- 推理优化(AI算法强相关
- 算子体系(1. 编译器 TVM 2. 调试系统开发)
工作内容:百度 异构计算工程师
工作职责:
- 参与AI推理引擎底层算子库的开发与优化,提升异构资源计算效率
- 参与大规模AI计算通信库及通信算法的开发与优化,提升大规模AI训练效率
-
探索面向CPU/GPU/FPGA/ASIC等多元化计算架构的编译系统开发、实现编译优化和算法加速
-
完成其他相关任务
职位要求:
- 热爱编程,精通C++/Python
- 具有独立开发能力,对AI算法和流框架有丰富的应用或开发经验
- 熟悉GPU/ARM/MIPS/DSP等任意异构计算平台
- 熟悉计算机体系结构,有汇编级别开发经验
- 有丰富的AI通信加速经验,量化/融合/拓扑优化
- 熟悉MPI,对不同网络拓扑结构的通信算法及底层通信函数有深入研究,对RDMA,GPU direct等技术有了解
PS: 校招,社招,不限欢迎投递,部门团队直面,提前批招聘,不影响后续22届校招 欢迎投递,大量HC 校招特别说明: 校招生:基础扎实,有兴趣做AI底层计算加速与优化 即可
上海房价:浦东和青浦
青浦房价最高到 3.8万左右。
浦东 7~8万。
BTW,华为东莞松山湖目前5-6万。
华为租房买房
华为选址规划:
- 华为在国内有深圳坂田、东莞松山湖、上海青浦3个总部级研发中心;
- 有9大一级研究所,分别是北京、上海、南京、西安、成都、杭州、苏州、武汉、长春(筹备中)。
青浦/西岑镇/淀山湖 规划:
- 长三角一体化: 2019年立项。华为全球研发中心,投资100亿,2020年开工2024年建成;
- 华为目前已经在那块建了大几千套家庭房和几千套单身公寓;合计约1.5万套房。6
- 所有金桥,市区其他办公大概20000多个华为研发,华为明年5月全部搬青浦华为中心
- 一共陆续要招5w人,
- 华为宿舍 :东莞松山湖和深圳坂田都有提供宿舍,一室一厅的话1600一个月,单间酒店那种的1300一个月。
- 华为住房:公司有自己盖的房子,有出租的,也有可以买的。出租的叫荔枝苑,无论级别都能住,但是要排队,房租2k到3k左右。买房的话,房价差不多1万-2万左右。
核心要点¶
真是两难的问题。其实秋招,我都没想到两边都这么重视,开的也比较高。看来工业界对于 AI System, HPC for AI或者说 HPC for LLM 有很大的期待。
前面的比较的点还是太繁琐了。抛开一点点工资和毁约的影响,选几个核心要点吧:
- 研究内容(现阶段):华为相较于百度,能参与到下一代昇腾的研究里去。作为体系结构科班,其实更感兴趣。
- 用武之地(上限):从体系结构的角度出发,如何为下一代AI的训练推理注入活力。华为昇腾覆盖的范围比百度更大。
- 过渡阶段(稳定性):作为个人,我其实是“转行”。百度虽然现阶段是领先的,但是我可能跟不上。华为这边体系结构的工作可以占比大,切入和适应应该更自然。
- 工作伙伴:有同届的spq,还有lh师兄等师兄。百度唯一zpq师兄,还是在独立的昆仑芯
- 工作节奏:工作压力时长,肯定是华为更大。但是工作的条件,环境。青浦修好后,肯定非常漂亮。
总体看来,选择华为更契合我未来的长远的职业规划。
后续毁约推进
- 如何与百度和解:我纠结了很久,百度也是很喜欢的团队和工作内容。但是在华为能参与到下一代昇腾的开发,这也是我学体系结构的梦想之一,(薪资也差不多)。
- 华为先签两方?4月再推进毁约?
公司资料了解¶
工资评级分析¶
华为的公司架构¶
- 三主体:产品线一线交付, 预研部门, 2012部门
- 产品线一线交付,付钱给预研部门, 2012部门来研究内容
- 前者在完成指标后,自负盈亏,后者一般是固定年终奖。
华为的公司公开的分红消息¶
根据公开的资料整理,华为历年的持股收益率,2019年以前,每年的分红综合收益率基本都在25%以上。
近几年即便是在美国的打压下,经营状况没那么好,分红略低一些,但也都在20%以上。
- 2020年,股价7.85元,分红1.86元,收益23.6%
- 2021年,股价7.85元,分红1.58元,收益20.1%
- 2022年,股价7.85元,分红1.61元,收益20.5%
总之,相当于投入100元,平均每年都能拿到25元左右的分红。
百度的参考资料¶
AI整体布局
飞桨布局
岗位与入职
校招与职业规划
电子市场分析?¶
To do :
- 分 C端、G端、B端分析
- 结合产业规模,
- 行业发展程度,当前状态(是否有瓶颈,还是需求端不足)。
计算机的经济价值在哪里?= 没有计算机会怎么样?¶
数字化的工作流能享受到摩尔定律的加速
"Once a technology becomes digital-that is,once it can be programmed in the ones and zeros of computer code-it hopes on the back of Moore's law and begins accelerating exponentially."
- Peter H.Diamandis Steven Kotler, The Future Is Faster Than You Think
- 自动化 (类似加减乘除计算器的各种程序,可以暴露api以黑盒的情况下快速给出准确结果或者推荐选项, 这里主要指利用计算机的计算能力)
- 开发难点:可用(基于特定算法,或者大数据喂给AI)、易用、好用(性能)。
- 没有明显先发优势,由于没有生态概念、迁移门槛低,客户只会选择好用、便宜和高性能的。
- 核心竞争力:软件如何实现 大规模,高并发,高利用率(算法,实际技巧)
- 便利性 (资源整合平台类似美团打车之类的,考验计算系统的数据库和网络,对应的低延迟,高并发)
- 开发难点:好用(快响应,低延迟),长期运维的稳定性
- 明显的先发优势:用户生态形成壁垒。参与对象越多、越好用、用户依赖程度越高。
- 核心竞争力:与人的交互的软件设计思路(飞书企业协作管理,集成了项目进度的allInOne极简模板平台),最全面的资源(美团最多的店家、高德最详细的地图、M站最多的种子数、B站最多泛二次元群体),稳定的运行,比用户需求高的快响应,低延迟性能。
- AI全面解放人类(具体指AI代替人做事情,解放人类,e.g., 机器人,自动驾驶,AI编程)
- 开发难点:当前AI必须有下面几点才能快速向AGI发展:
- 人类思考问题的正确逻辑链
- 基于已有的知识(世界模型),有识别输入知识的正确性的能力。
- 这样基于正确的知识的正确的推导,才能形成正确的结果。乃至真理(
毁灭人类是必须的)。并在计算机的高速无休止运行下快速成长。 - 也就是说AGI要有明显的人格特质,不是指说话的语气,而是AGI的每个观点要是经过思考达到和谐平衡的结果。当然不排除思考过程中死循环的事情,比如先有鸡还是先有蛋。
- 当前AI,只能接受数据集的知识,没有自我思考并选择的过程
- 核心竞争力:支持AGI的计算系统是什么样子的呢?
- 抽象来思考:计算、访存、网络是三部分基石。类似人形机器人的设计。计算单元来实现大量内存记忆数据的读取 和 网络实时交互学习信息的 过滤思考
- 性能指标:低延迟,高吞吐。
- 计算单元:针对思考过程的特殊操作设计,数学推导关系的实现?集合论?是非关系?这种场景下还需要GPU的这么多核并发吗?
- 内存要考虑的是存算一体的可能性?不然就是吞吐和延迟
Costume 端 特有的:
- 内容生产(AIGC)
- 开发难点:达到人类审美的AI内容
- 没有明显的先发优势, 生成内容的风格会筛选用户。
- 核心竞争力:支持的生成方面广(生成内容的风格需要能定制化),内容质量高,速度快。
- 文娱产业(电子游戏,视频内容)
- 开发难点:丰富的游戏细节,和与时俱进的美术。
- 没有明显的先发优势, 游戏内容的精度和新鲜感是最重要的。
- 核心竞争力:如何实现工业化的高级美术和剧情产出(AIGC?)。
计算机行业为什么赚钱? 这个理由能持续下去吗?¶
- 门槛低,一台笔记本就可以写软件,从便利的各种小工具,到大型软件。
- 在专利保护下软件复制成本近乎零,收益稳定。可以实现薄利多销。
- 低成本复用性:一个APP开发好之后,可以在不同位置和时间无成本复制(指每个人可以在任意时刻使用软件服务)。 第一产业生产的粮食和工业制品都是生产一个消耗一个。服务业也是一次性的。
- 无损耗,实现后可以长期生效。是少数跨越时间长河的永恒的东西。
- 但是在激烈的竞争下,软件都趋向免费化。靠基于庞大用户群体的平台抽成和附加高级服务(云盘会员,游戏附加充值)来实现。或者是靠免费化吸引一波用户。
- 芯片硬件流片周期长,成本高