功能总览
英博云是专为 人工智能计算场景 打造的云服务平台,提供强大、灵活的 GPU 算力,支撑模型训练、推理部署、数据处理等关键环节。本章内容主要介绍英博云管理平台中一些重要的概念。帮助您更快速的理解和使用英博云平台。
集群
集群对应kubernetes中的Cluster,无需运维。英博云不仅支持通过页面创建开发机实例,同时支持通过原生的K8S命令在集群中创建使用任意配置的开发机,不局限于部分规格。可更灵活的通过原生k8s命令来管理进行开发机的创建删除修改工作。
- 参考 创建集群
- 支持kubectl连接集群
开发机
开发机可以简单的理解为一台挂载了GPU卡的计算环境,专为人工智能研发场景深度调优。其核心由高性能GPU算力集群驱动,预装主流深度学习框架(如PyTorch、TensorFlow)、开发工具链及自动化部署系统。形成开箱即用的AI工作站。
开发机是专为AI研发设计的全流程工作环境,核心能力覆盖从开发到部署的全周期需求。
- 参考 创建按量付费开发机。
- 参考 创建包年包月开发机。
- 参考 创建预定模式开发机。
- 参考 创建spot竞价开发机。
- 支持SSH连接开发机,也可通过平台预置的桌面化工具操作使用您的开发机。请参考 ssh远程登录、jupyterlab。
存储
在 AI 算力全流程中,存储 是保障数据高效流转和模型稳定运行的核心组件。围绕 AI 业务特性,我们为您提供三种存储服务。
高性能共享存储SSD:适合高吞吐、低延迟的I/O密集型场景,如数据库、虚拟化和实时分析。
共享存储HDD:适合访问频率低的冷数据,如备份、归档等场景。
- 参考 创建共享存储。
块存储:适合需要高性能、低延迟的场景,如虚拟机、数据库和I/O密集型应用。
- 参考 创建块存储。
对象存储:适合需要快速部署的分布式边缘计算场景,全平台兼容免挂载。
- 参考 创建对象存储。
镜像
用于构建开发机的模版,预置了常见的Pytorch、TensorFlow、vllm等GPU深度学习开发框架镜像,您可直接使用该镜像构建您需要基础环境。无需手动安装,同时支持原生的Ubuntu镜像,可自主构建需要的各种AI场景。
- 参考 镜像简介。
模型和数据集
在您使用开发机时,系统内置了公共数据仓库,数据仓中包含Huggingface常见的模型和数据集,帮助您专注于任务本身,免去90%的数据准备时间,节省公网流量费用和等待耗时同时降低存储成本的开销。
团队模式
英博云团队模式面向教学科研团队、企业项目组提供统一的算力资源管理与协作环境,帮助团队高效分配资源、统一监控成员使用情况、降低管理成本。
- 参考 团队模式。