功能总览

英博云是专为 人工智能计算场景 打造的云服务平台,提供强大、灵活的 GPU 算力,支撑模型训练、推理部署、数据处理等关键环节。本章内容主要介绍英博云管理平台中一些重要的概念。帮助您更快速的理解和使用英博云平台。

集群

集群对应kubernetes中的Cluster,无需运维。英博云不仅支持通过页面创建开发机实例,同时支持通过原生的K8S命令在集群中创建使用任意配置的开发机,不局限于部分规格。可更灵活的通过原生k8s命令来管理进行开发机的创建删除修改工作。

开发机

开发机可以简单的理解为一台挂载了GPU卡的计算环境,专为人工智能研发场景深度调优。其核心由高性能GPU算力集群驱动,预装主流深度学习框架(如PyTorch、TensorFlow)、开发工具链及自动化部署系统。形成开箱即用的AI工作站。

开发机是专为AI研发设计的全流程工作环境,核心能力覆盖从开发到部署的全周期需求。

存储

在 AI 算力全流程中,存储 是保障数据高效流转和模型稳定运行的核心组件。围绕 AI 业务特性,我们为您提供三种存储服务。

高性能共享存储SSD:适合高吞吐、低延迟的I/O密集型场景,如数据库、虚拟化和实时分析。

共享存储HDD:适合访问频率低的冷数据,如备份、归档等场景。

块存储:适合需要高性能、低延迟的场景,如虚拟机、数据库和I/O密集型应用。

对象存储:适合需要快速部署的分布式边缘计算场景,全平台兼容免挂载。

镜像

用于构建开发机的模版,预置了常见的Pytorch、TensorFlow、vllm等GPU深度学习开发框架镜像,您可直接使用该镜像构建您需要基础环境。无需手动安装,同时支持原生的Ubuntu镜像,可自主构建需要的各种AI场景。

模型和数据集

在您使用开发机时,系统内置了公共数据仓库,数据仓中包含Huggingface常见的模型和数据集,帮助您专注于任务本身,免去90%的数据准备时间,节省公网流量费用和等待耗时同时降低存储成本的开销。

团队模式

英博云团队模式面向教学科研团队、企业项目组提供统一的算力资源管理与协作环境,帮助团队高效分配资源、统一监控成员使用情况、降低管理成本。