DeepSeek 视觉中国 材料图 DeepSeek成为了国内外各年夜云厂商的骄子。 1月20日,中国AI始创公司深度求索(DeepSeek)推出年夜模子DeepSeek-R1。作为一款开源模子,R1在数学、代码、天然言语推理等义务上的机能可能比肩OpenAI o1模子正式版,并采取MIT允许协定,支撑收费商用、恣意修正跟衍生开辟等。停止2月5日,海内外已有浩繁云平台发布上线DeepSeek- R1年夜模子。 克日,华为云、腾讯云、阿里云、百度智能云等海内主流云平台纷纭发布上线R1年夜模子。2月5日,挪动云发布片面上线DeepSeek,实现全版本笼罩、全尺寸适配、全功效畅用。中国挪动笼罩天下的13个智算核心片面上线上述才能,用户可抉择任一智算资本池停止安排、蒸馏、智能体编排等操纵。 统一天,中国联通也发布,联通云已基于星罗平台实现国产及主流算力适配多规格DeepSeek-R1模子,统筹私有化跟私有化场景,供给全方位运转效劳保证。联通云基于A800、H800、L40S等多款主流算力卡,预置DeepSeek-R1多尺寸模子,用户可按需机动抉择、疾速扩大,疾速搭建DeepSeek-R1推理跟微调情况。 此前,2月4日,京东云发布,言犀AI开辟盘算平台已支撑DeepSeek-V3、DeepSeek-R1以及全部蒸馏小参数模子(DeepSeek-R1-Distill)的一键安排,支撑私有云在线安排、专混私有化实例安排两种形式,供用户按需安排,疾速挪用。 2月4日,字节跳动旗下的火山引擎发布,将支撑 V3/R1 等差别尺寸的 DeepSeek 开源模子,能够经由过程两种方法停止模子应用:一是在火山引擎呆板进修平台 veMLP 中安排,现在 veMLP 曾经支撑全尺寸 DeepSeek 模子, 并细心对 SGLang 跟 vLLM 做过机能调优跟后果评测,火山引擎自研 PD 分别+EP 并行的推理引擎也行将推出,片面开放。实用于本人停止模子定制、安排、推理的企业。二是在火山方舟中挪用模子,实用于冀望经由过程 API 疾速集成预练习模子的企业,现在曾经支撑4个模子版本,并供给了全网最高的限流。 2月3日,百度智能云发布,百度智能云千帆平台已正式上架DeepSeek-R1跟 DeepSeek-V3模子,推出了超廉价格计划,R1模子输入价钱为2元每百万token,输出价钱为8元每百万token。用户还可登录百度智能云千帆ModelBuilder享用限时收费效劳。 据先容,百度智能云此次接入的模子已片面融会百度千帆推理链路,集成百度独家内容保险算子,实现模子保险加强与企业级高可用保证,同时支撑完美的BLS日记剖析(支撑查问跟剖析的API挪用日记)跟BCM告警(分钟级监控指标告警),助力用户保险、稳固地构建智能利用。 同样是在2月3日,阿里云发布,阿里云PAI Model Gallery支撑云上一键安排DeepSeek-V3、DeepSeek-R1。现在DeepSeek-R1支撑采取vLLM减速安排;DeepSeek-V3 支撑vLLM减速安排以及Web利用安排;DeepSeek-R1蒸馏小模子支撑采取BladeLLM(阿里云PAI自研高机能推理框架)跟vLLM减速安排。 2月2日,腾讯云发布,R1年夜模子一键安排至腾讯云高机能利用效劳HAI上,开辟者仅需3分钟就能接入挪用。简略来说,经由过程HAI,开辟者能够省去繁琐步调,只要两步即可挪用R1模子,默许加载1.5B参数模子。假如1.5B模子无奈满意需要,可在下令行后输入7B/8B/14B等参数指令,自在切换至对应规格的模子。 两天后,腾讯云又发布推出“开辟者年夜礼包”,DeepSeek全系模子一键安排,从“满血版”671B参数到轻量版1.5B参数都包含在内。腾讯云供给了机动的付费形式,安排实现后,开辟者可在线休会模子后果,还能够获取API挪用地点,秒速接入各种AI利用。 2月1日,据华为云官方微旌旗灯号,硅基活动跟华为云团队结合首发并上线基于华为云昇腾云效劳的DeepSeek R1/V3推理效劳。 公然材料表现,北京硅基活动科技无限公司专一于打造天生式AI盘算基本设备平台。据先容,得益于自研推理减速引擎加持,硅基活动跟华为云昇腾云效劳支撑安排的DeepSeek模子可取得持平寰球高端GPU安排模子的后果,同时可能供给稳固的、出产级效劳才能,让模子可能在年夜范围出产情况中稳固运转,并满意营业商用安排需要。 随后,华为还发布,DeepSeek系列新模子正式上线昇腾社区,支撑一键获取DeepSeek系列模子跟昇腾硬件平台上开箱即用,且基于原生鸿蒙操纵体系的小艺助手App曾经接入DeepSeek。 别的,无问芯穹、青云科技、PPIO派欧云、云轴科技等自力云厂商均已发布适配及上架DeepSeek模子效劳。 另一边,海内各年夜云厂商跟芯片厂商在更早之前就已纷纭发布上线DeepSeek-R1模子。北京时光1月31日,英伟达发布DeepSeek-R1模子登岸NVIDIA NIM。据先容,在单个英伟达HGX H200体系上,完全版DeepSeek-R1 671B的处置速率可达每秒3872 Token。英伟达竞争敌手AMD也发布,已将新的DeepSeek-V3模子集成到Instinct MI300X GPU上,针对Al推理停止了优化。 两年夜云巨子亚马逊AWS跟微软Azure也接入了DeepSeek-R1模子。从1月30日起,AWS的用户能够在Amazon Bedrock跟Amazon SageMaker AI中安排DeepSeek-R1模子。AWS方面表现:“经由过程亲密存眷客户需要跟技巧提高,AWS按期扩展咱们经心筛选的模子抉择,以包含有前程的新模子以及既定的行业最爱。高机能跟差别化模子产物的连续扩大有助于客户坚持在AI翻新的最前沿。” 外地时光1月29日,微软发布DeepSeek-R1已在Azure AI Foundry跟GitHub上供给,开辟者能够用新模子停止测试跟构建基于云的利用顺序跟效劳。微软客户可能应用R1模子的精简版本在微软AI电脑Copilot+PC上当地运转。微软方面表现:“作为Azure AI Foundry的一局部,DeepSeek-R1能够在一个值得信任的、可扩大的跟为企业做好筹备的平台上拜访,使企业可能无缝集成进步的AI,同时满意SLA(效劳程度协定)、保险性跟担任任的AI许诺。” 新浪财经大众号 24小时转动播报最新的财经资讯跟视频,更多粉丝福利扫描二维码存眷(sinafinance)