在线咨询
0086-416-7873535
官方微信
官方微信
英伟达GPU的编程东西
来源:抖圈- 为du而生
发布时间:2025-12-23 13:32
 

  别的一种餐馆的模式叫做多厨房并行模式。正在面临大型勾当,例如音乐节、体育赛事、公司年会时,保守餐馆的模式明显不敷用。这时,办理团队凡是会采用多厨房并行模式。好比凉菜由厨房A担任,热菜由厨房B担任,甜点由厨房C担任。各个厨房相互,能够同时处置订单的分歧部门,最终将所有完成的菜品汇总到地方区域,再同一交给顾客。这种方式充实操纵了多个厨房的并行性,正在全体上显著缩短了办事时间。这种多厨房协同模式,就雷同于法式设想中的并行编程模子。

  英伟达的GPU硬件采用的就是这种并行编程模子。由于英伟达的GPU里有大量的流处置器(Streaming Processor, SP),每个都能工做,就像有良多个小厨房。并且GPU次要处置的是图像衬着、科学计较这些容易并行的使命。所以并行编程模子出格适合GPU,CUDA就是特地为这个设想的。CUDA不只是一套编程法则,它还把复杂的底层操做给包拆起来了。以前用GPU,法式员得本人管显存、安排线程,出格麻烦。有了CUDA,这些复杂的工作系统从动帮你搞定,你只需要分心想“我要做什么”,而不消费心“怎样做”。

  这项决策虽然计谋意义深远,但却正在短期内带来了昂扬的价格。为了让所有显卡支撑CUDA,英伟达不得不承担庞大的成本压力。正在2008至2010年间,英伟达的毛利率从45。6%降至35。4%。再加上2008年的全球金融危机,英伟达面对了庞大的贸易冲击,其股价正在短短一年多时间内暴跌了80%。

  英伟达的显卡就像是一把锤子,本来是用来敲钉子。然而,他们但愿这把锤子可以或许正在更多范畴阐扬感化。为此,他们对这把锤子进行了全面,不只让它的布局愈加矫捷,还为这个锤子开辟了一套利用方式,帮帮利用者更高效地操控这把锤子。

  CUDA全名叫Compute Unified Device Architecture,说白了就是一套让法式员更好用英伟达GPU的编程东西。正在讲CUDA之前,我得先说说什么是“编程模子”。其实很简单,按着这套法则写法式,就能更高效地用硬件干活。分歧的场景、分歧的硬件前提、分歧的使命下,分歧的编程模子的结果是分歧的。

  做个类比。就像一台高端相机,硬件很牛,但要用好它,你得懂、快门、ISO这些专业学问,晓得各类专业参数怎样调,门槛太高。所以厂商搞了“智能场景模式”——好比活动模式、夜景模式等等,通俗人一键就能拍出好照片。CUDA就是GPU的“智能场景模式”。它供给了丰硕的东西,闪开发者无需特地研究GPU架构,也能高效完成本人的编程使命。并且,CUDA支撑风行的编程言语,例如C、C++、Python、MATLAB等,让科学家和工程师不消成为硬件专家,就能用上GPU的强大计较能力。

  有个很抽象的例如能够描述CUDA:理解CUDA的体例就是,你具有一张视频逛戏显卡,但它配备了一个开关,CUDA就是这个开关,你只需要轻拨一下,就能够实现你想要的功能。然而,CUDA虽然强大,但价格也是庞大的。G80是英伟达第一款支撑CUDA的GPU。为了开辟这款芯片,英伟达花了整整4年时间,成本高达4。75亿美元,占了那4年总研发预算的三分之一。要晓得,以前每代GeForce芯片开辟周期才1年。

  投资者们起头埋怨英伟达持续投资CUDA并无财政意义。有人说:“英伟达正在这个新的芯片架构上投入了大量资金,花费了数十亿美元,却对准了学术和科学计较这一偏门范畴,而其时这并非一个大市场——远不及他们投入的数十亿美元。”。

  这还只是“一个”支撑CUDA的GPU。其时英伟达内部辩论激烈:是不是所有GPU都要支撑CUDA?最后的打算是只正在高端科学和手艺工做坐显卡上支撑CUDA,但黄仁勋要正在全产物线推广,包罗逛戏用的GeForce系列。让它成为根本性手艺。”由于他有一个设法:利用CUDA的人越多,这项手艺成为尺度的速度就越快,就越有可能找到新的使用。

  例如,其时英伟达费尽心思地寻找那些实正需要这种强大机能的用户。州全科病院的研究人员曾致信英伟达,为他们的乳腺X光扫描仪进行升级。黄仁勋邀请这家病院参取CUDA的初步测试,正在一个试点项目中投入了数百万美元,但最终仅售出两块显卡。更蹩脚的是,CUDA软件下载量持续下滑,至2012年降至最低点,新安拆量仅10万次出头。

  可是,他们拿着这把锤子四处向人推销,却发觉没人对这把锤子感乐趣。曲到有一天他们来到了一口,门牌上写着六个字:深度神经收集。

  2013岁首年月,良多投资阐发师认为,若是英伟达遏制正在CUDA上烧钱,股价才会涨,以至有人起头质疑黄仁勋继续当CEO能否合适。