惠普|惠普最新推出的AI开发平台测评:多用户协同开发模型和算力资源管理的有力工具!( 三 )


数据科学工作站与公有云或数据中心相比 , 不仅性价比高 , 更容易部署 , 而且噪音低 , 可以让中小型AI开发团队直接在办公区内进行协同开发 。
惠普最近升级的 HP Z8 G4 数据科学工作站以其强大的性能表现 , 稳定可靠的安全性 , 以及全方位的系统和软件支持 , 在专业领域工作环境下 , 为使用者提供了绝佳的高性能计算解决方案 。
同时 , 惠普最新还推出了一款基于 Docker+Kubernetes 的人工智能容器云平台HP AI开发平台 。 该平台能够实现异构资源的高效管理、调度和监控 , 提供了从模型开发、训练到部署的完整流程和工具 , 广泛适用于教育、科研、金融、医疗、能源各个行业 , 能极大降低人工智能进入门槛 , 提高人工智能创新和研发的效率 。
为了让中小型AI开发团队更切实更全面地认识 HP Z8 G4 数据科学工作站以及 HP AI 开发平台在团队协作开发中的价值 , 智东西公开课AI教研团队联合两位 Kaggle Grandmaster 模拟现实开发 , 对 HP AI 开发平台的功能应用 , 及其在 HP Z8 G4 数据科学工作站上的使用体验两个方面进行了深入评测和项目实验 。
智东西公开课AI教研团队主要承担在 HP Z8 G4 数据科学工作站中安装 HP AI 开发平台 , 并且作为管理员进行资源管理 。 两位 Kaggle Grandmaster 将基于我们分配的资源 , 协同完成基于数据集 CASIA-SURF 的人脸活体检测 , 以及基于数据集 STS-B 的自然语言文本分类这两项实验 。
两位 Kaggle GrandMaster 分别是关注自然语言处理领域的算法工程师吴远皓和从事医疗AI算法研发工作的算法工程师沈涛 。 吴远皓已参加超过20场Kaggle竞赛 , 获得8枚金牌 , 并于2019年成为 Kaggle Competitions Grandmaster, 全球最高排名第36位 。 沈涛在机器学习竞赛平台 Kaggle 上共得到11块金牌 , 获得了 Kaggle Grandmaster 称号 , 全球最高排名第8位 。
在进入正文介绍 HP AI 开发平台的功能及实验之前 , 我们先来了解一下本次使用的 HP Z8 G4 数据科学工作站的核心参数 , 如下:

图表0.0.1再给大家看看3块 NVIDIA A5000 显卡安装好之后的实际展示 。 下图中的“三条金色模块”即为 NVIDIA A5000 显卡 。

图表0.0.2下图是 HP Z8 G4 数据科学工作站实际工作的展示:

图表0.0.31、HP AI 开发平台功能全解
本章节将为大家展示 HP AI 开发平台的安装过程和架构组成 , 并重点介绍其为开发者所提供的模型训练、数据存储、任务镜像 , 以及向管理者所提供的用户权限、监控中心、系统设置等特色功能 。
下面进入 HP AI 开发平台的安装 。 HP AI 开发平台的安装包是适用于 Unix 系统和类 Unix 系统的.run 格式文件 , 整个安装过程分三步 , 十分简单:
第一步 , 在 Ubuntu 系统的终端中 , 输入:
“sudo bash AI_HP -Evaluation-4.5.1-HP-63045-offline.run”即可进行安装 。
第二步 , 成功安装完成后 , 会显示:
“Please visit htp://192.168.88.80:5678 to continue installation.” 。 此时浏览器输入网址后会看到平台的环境正在初始化 。
第三步 , 平台环境初始化完成后 , 会自动跳转到 HP AI 开发平台的登录界面 , 此时输入账号密码即可完成登录 。 下图为 HP AI 开发平台的首页展示 。

图表 1.0.11、平台架构
图表 1.1.11.1、基础设施层
基础设施层以X86的服务器、专业工作站为载体 , 可通过 GPU、CPU 等提供高性能加速计算 , 支持 TCP/IP , InfiniBand 高速网络互联 , 以及 NFS 和 GlusterFS 两种类型的存储格式 。
1.2、资源调度层
采用容器化技术管理底层资源 , 并利用 Kubernetes(K8s)技术进行容器编排调度 。

相关经验推荐