算力规格
裸金属
容器云
区域:乌兰察布
区域:乌兰察布
区域:哈密
其他
算力交付
超算平台机时服务
按量计费
适用场景: 追求高效、易用的通用的高性能计算场景。
快速接入并利用超算资源,无需关心底层硬件维护,根据实际使用的计算时长付费。我们提供了强大的超算管理平台,支持一键式资源调度、作业提交与监控等功能,兼容多种主流科学计算软件,降低了用户的迁移成本和技术门槛。
快速接入并利用超算资源,无需关心底层硬件维护,根据实际使用的计算时长付费。我们提供了强大的超算管理平台,支持一键式资源调度、作业提交与监控等功能,兼容多种主流科学计算软件,降低了用户的迁移成本和技术门槛。
通算-裸金属节点/集群
包年包月/按量计费
适用场景: 关注性能与数据安全的应用与大数据服务部署。
用户独占专属裸金属节点,通过快速部署工具和全天候技术支持,帮助客户轻松上线并高效管理其应用,满足业务需求的同时保证运行的稳定性和安全性。支持以包年包月方式或按量计费方式进行结算。
用户独占专属裸金属节点,通过快速部署工具和全天候技术支持,帮助客户轻松上线并高效管理其应用,满足业务需求的同时保证运行的稳定性和安全性。支持以包年包月方式或按量计费方式进行结算。
通用计算云主机
按量计费/包年包月
适用场景: 应用部署、开发与测试。
提供基于x86和ARM的多种处理器的云主机服务。通过简便快捷的资源配置与管理工具,客户能够迅速启动并调整其云主机实例,同时享有全面的技术支持和高可靠性保障,确保业务的连续性和灵活性。用户可根据自身业务特点灵活选择包年包月或按量计费的结算方式。
提供基于x86和ARM的多种处理器的云主机服务。通过简便快捷的资源配置与管理工具,客户能够迅速启动并调整其云主机实例,同时享有全面的技术支持和高可靠性保障,确保业务的连续性和灵活性。用户可根据自身业务特点灵活选择包年包月或按量计费的结算方式。
智算-裸金属节点
包年包月
适用场景: 较大规模的模型训练或推理服务场景。
用户独占若干台物理服务器资源;可通过云平台提供的WebSSH或通过Xshell、putty等客户端访问和操作服务器;可挂载分布式存储;可配置专用虚拟网络;可按照用户需要部署指定的操作系统。
用户独占若干台物理服务器资源;可通过云平台提供的WebSSH或通过Xshell、putty等客户端访问和操作服务器;可挂载分布式存储;可配置专用虚拟网络;可按照用户需要部署指定的操作系统。
智算 AI 容器云
按量计费/包年包月
适用场景: 多用户共用的AI/机器学习研发、训练、测试、部署场景。
为用户提供便捷易用的AI/机器学习加速开发平台,提供基于Jupyter/VSCode的模型算法开发环境、高效易用的多机多卡模型训练任务管理和推理服务管理、环境镜像管理、模型管理、数据集管理等功能;提供用户间的私有数据隔离和公共数据共享。
为用户提供便捷易用的AI/机器学习加速开发平台,提供基于Jupyter/VSCode的模型算法开发环境、高效易用的多机多卡模型训练任务管理和推理服务管理、环境镜像管理、模型管理、数据集管理等功能;提供用户间的私有数据隔离和公共数据共享。
大模型 API
按 token 计费
适用场景: 大模型应用对大模型算力调用。
提供了符合 OpenAPI 规范的标准化接口,使得客户能够轻松地与平台上的多种大模型服务对接。提供包括满血版 DeepSeek 在内的多种常用大模型的推理服务调用接口。
提供了符合 OpenAPI 规范的标准化接口,使得客户能够轻松地与平台上的多种大模型服务对接。提供包括满血版 DeepSeek 在内的多种常用大模型的推理服务调用接口。
超算节点/集群
/包年包月
适用场景: 高定制化要求的高性能计算场景。
用户独占专属超算服务器。裸金属服务非常适合需要处理大量敏感数据或运行高性能计算任务的用户。用户可根据自己的需求自由配置操作系统、超算调度软件及超算应用软件,享受如同本地部署般的灵活性与控制力。
用户独占专属超算服务器。裸金属服务非常适合需要处理大量敏感数据或运行高性能计算任务的用户。用户可根据自己的需求自由配置操作系统、超算调度软件及超算应用软件,享受如同本地部署般的灵活性与控制力。
典型场景资源推荐
DeepSeek R1满血版推理服务DeepSeek R1满血版推理服务DeepSeek R1满血版推理服务
DeepSeek R1满血版推理服务描述
全面激活该模型6710亿参数(MoE架构,激活参数约370亿)的巅峰性能,其推理能力可比肩国际顶级模型,在复杂推理、数学运算、代码生成等高端任务中表现突出,同时有效优化幻觉问题,幻觉率较旧版降低45%-50%,输出更精准可靠。服务支持API快速调用与灵活部署,兼容多元硬件架构,可提供私有化部署与按需付费两种模式,无需用户投入巨额成本搭建专属算力环境,即可便捷享受满血版推理能力,大幅降低高算力推理门槛。此外,服务搭配全流程工具链与24小时专业技术支撑,实现推理全流程可视化管控,简化运维复杂度,适配科研研发、企业数字化、专业场景定制等多领域差异化推理需求,兼顾安全性、可扩展性与高效性,最大化释放DeepSeek R1满血版的核心推理价值,助力用户高效完成高难度推理相关任务。
典型行业应用大模型
打造“算力底座+行业大模型+场景化解决方案”一体化服务体系
聚焦文旅、电力、制造、政务等重点行业,破解行业数字化转型中的算力不足、模型落地难、价值转化慢等痛点,推动大模型技术从“可用”向“好用”升级,赋能各行业高质量发展。提升研发效率、优化生产流程,破解企业算力利用率低、研发周期长的痛点,助力产业智能化升级。
70B 大模型推理服务
打造高效、精准、安全、低成本的企业级推理服务体系
部署模式灵活多元,支持 API 快速调用、私有化部署与按需付费三种模式,无需用户投入巨额成本搭建专属算力环境,可根据业务需求动态调整算力资源,适配不同规模企业的差异化需求——小型团队可通过按需付费轻量化使用,大型企业可依托私有化部署保障核心数据安全与业务自主性,同时兼容 vLLM、TensorRT-LLM 等主流推理引擎,支持二次开发与行业微调,适配多硬件架构无缝衔接。
35B 大模型推理服务
破解大模型推理过程中显存占用偏高、部署繁琐、成本可控性弱等核心痛点。
配套全流程服务保障,搭建统一可视化管理平台,集成多种监控工具,实现推理任务调度、GPU 利用率监控、性能监控、故障预警全流程管控,简化运维复杂度,无需专业运维团队即可快速上手;搭配 24 小时专业技术支撑与定制化优化服务,可针对金融风控、智能制造、科研研发、政务分析、智能客服等不同行业场景,优化推理参数与部署方案,最大化释放 35B 大模型推理价值,助力用户高效完成各类推理相关任务,加速 AI 技术与业务的深度融合。