标签云
企业级中端全闪存储系统 路由交换机 分布式文件系统 24口光纤交换机 融合存储 26口百兆交换机 NVIDIA 服务器 英伟达服务器 边缘计算 混合阵列 NVIDIA A100 虚拟化 HPC集群 DGX-2 28口工业交换机 网络管理软件 高性能VPN网关 3070 机架服务器 8卡GPU服务器 边缘微中心 21-30口交换机 超高密度存储服务器 47U机柜 框式敏捷交换机 DGX-2服务器 25口百兆交换机 训练卡 高端存储 统一存储 DAS存储 chia 28口万兆交换机 均衡服务器 安全网关 OA/ERP服务器 32口千兆交换机 高端智能全闪存存储系统 1U单路服务器 大数据 机器学习服务器 12口工业交换机 模拟仿真工作站 52口万兆交换机 DGX-1 20UR路由器 24口交换机 4口安防交换机 10口及以下交换机 44口工业交换机 2U机架服务器 二层交换机 企业级高端全闪存储系统 企业网VPN 虚拟化交换机 52口工业交换机 10/40GE交换机 风冷服务器 中高端双路塔式服务器 会议平板
在家中安装专用的深度学习工作站,这样可以通过更快的训练来节省模型制作原型的时间,同时减少反馈时间并简化结果分析。
节省金钱也是一个优先事项,因为使用的Amazon Web Services(AWS)(使用Nvidia K80 GPU提供P2实例)每月花费超过300美元,而且存储大型数据集(如ImageNet)的成本很高。
但是,有一些重要的事情要考虑,因此为那些想要构建自己的盒子的人提供了一些方便的提示。
1、选择正确的配置
您选择的组件将确定工作站的成本。但是,的预算是4000美元,相当于2年在AWS上的支出。因此,建造自己的盒子的成本效益是毫不费力的。
显卡
随着神经网络完成数千个操作,GPU速度非常重要。 GPU之所以高效,是因为它们具有很高的内存带宽,并且在使用大量数据时可以并行运行操作。它们还具有大量可以运行大量线程的核心。
GPU是至关重要的组件,因为它决定了反馈周期的速度以及深度网络的学习速度。这一点也很重要,因为大多数计算都是矩阵运算(例如,矩阵乘法),当在CPU上完成运算时,这些运算会变慢。
您可以从Nvidia的卡中选择GPU,包括RTX 2070,RTX 2080,RTX 2080 Ti,RTX Titan甚至RTX Quadro卡。
如果您确实需要速度,则RTX 2080 Ti比RTX 2080快30%左右,而RTX 2080比RTX 2070快25%左右。
什么才是好的GPU?
GPU选择GPU时要考虑的事项包括:
品牌:建议您从Nvidia购买。过去几年,他们一直专注于机器学习,而CUDA工具包是深度学习从业人员的最佳选择。相比之下,AMD产品可能更便宜,但效率不高。
预算:值得考虑最适合您预算的商品。以前,您可以在基于Maxwell的旧Titan X上使用相同速度的半精度(FP16),有效地使GPU内存增加一倍,但是遗憾的是,这不能在新的GPU上实现。
一个还是几个?建议使用2080 Tis。这样,就可以在两张卡片上训练一个模型或同时训练两个模型。
尽管PyTorch和Caffe 2随GPU的数量提供几乎线性的缩放比例,但是事情正在发生变化,因此在多张卡上训练模型可能会很麻烦。也就是说,一次训练两个模型似乎可以提供更多价值。但是,决定购买2 x 2080 Ti BIZON G2000,以期以后再购买两个GPU。
内存:有了更多的内存,您可以部署更大的模型并在训练过程中使用足够大的批处理大小,这有助于梯度流动。
内存带宽:这使GPU可以在大量内存上运行,并且可以视为GPU的最重要特征之一。
考虑到所有这些因素,为深度学习盒选择了RTX 2080 Ti,以提高训练速度,并且计划再增加两台2080 Ti。
中央处理器
CPU尽管图形处理单元(GPU)是深度学习中最小的可行产品,但中央处理单元(CPU)仍然很重要。
数据准备通常在CPU上完成,如果要同时运行不同的数据集,则需要考虑内核和线程的数量。
选择了最新的英特尔酷睿i9-9820X,因为它是中端产品,价格相对便宜,在速度方面足够有效,并且是预算范围内的最佳选择。
注意PCle Lanes
根据Andrej Karpathy的说法,使用DL /多GPU,您应该“注意CPU /主板支持的PCIe通道”。
您希望每个GPU都有16个PCIe通道以尽可能快地处理数据(PCIe 3.0为16 GB / s)。这意味着对于两个卡,需要32个PCIe通道。
如果选择具有16通道的CPU,则2个GPU将以2x8模式而不是2x16运行。但是,这可能会导致瓶颈,并且无法充分利用图形卡的容量,因此建议使用40行的CPU。
蒂姆·迪特默斯(Tim Dettmers)指出,对于两个GPU,每张卡8条通道只能将性能降低“ 0–10%”。因此,您可以使用8条通道,但建议每个视频卡使用16条PCle通道。
对于双GPU机器,Intel Core i9 9820X(44个PCIe通道)是理想的选择。另外,如果您有更大的预算,建议您选择高端处理器,例如Core i9-9940X。
内存
RAM如果您使用的是大型数据集,则最好获取尽可能多的内存(RAM)。购买了2个16 GB的存储棒,并计划将来再购买32 GB。
固态硬盘
决定为操作系统和数据存储选择快速固态驱动器(SSD)磁盘。还购买了用于大型数据集的慢速旋转硬盘驱动器(HDD)。
SSD:记得当购买第一台Macbook Air时,对SSD的速度印象深刻。但是,称为NVMe的新一代SSD已进入市场。
500 GB SSD PCIe驱动器提供了很多功能,同样令人印象深刻,每秒可复制1 GB的文件。
HDD:尽管SSD的速度一直在提高,但HDD的价格却越来越便宜。建议使用2 TB的存储空间,它比Macbook提供的空间要大得多,并且是一个很大的改进。
主板
主板在选择主板时,考虑到它可以支持四个RTX 2080 Ti,包括PCI Express通道数(最小为2x8)和4个卡的物理尺寸,还需要确保它与CPU兼容。 BIZON G2000使用市场上最好的工作站工作站主板,专为多GPU系统而设计。
电源
电源您的电源应为CPU和GPU提供足够的汁液,外加100瓦。 1600W EVGA电源是质量最好,十年保修的最佳推荐电源。
联系电话
微信扫一扫