预计所需阅读时间:4分钟

最近矿机稳定运行超过一个星期了,终于可以安心地赚挖矿的钱。

最初在五月的时候用自己的笔记本学会了挖ETH,当时用PhoenixMiner,重要的是学会配置自己的矿工地址,这样算完成了挖矿的第一步。自己尝试超频去挖矿,结果对算力没有提升,还稍微提高了功耗。然后,就开始了解起显卡、算力、挖矿软件等方面信息。总体来说,显卡在电商平台溢价很严重,当时是原来的2到3倍,很多型号都要抢。于是,自己想到当初想级一台3080显卡的整机来做深度学习计算,就按深度学习这个关键词搜索起来。发现整体的组装机或品牌机还是有货的,但品牌机的性价比不高,组装机还行,显卡溢价的钱,商家还是要赚的,优点是有货,相对于专业矿机,电脑的配件是通用的。于是装了一台2卡的3080深度学习机。

买回来运行挖矿软件,发现算力没有达到预期,其中上面那张显卡下降得很严重,只有50多,下面那张还勉强有80多。于是去相关的原因,发现30系显卡用的是DDR6代的显存发热量巨大,要为显存增加额外的散热能力。当时看到有两种方法,一是在显存背面额外的散热贴与风扇,二是更换显存的导热贴。同时,看到有个视频展示,更换了莱尔德HD9000的导热贴,显存温度明显下降。然后,就买了2mm厚的导热贴去更按,决定拆显存的散热模块。更换导热系数更好的导热贴之后,发现算力都有所回升,一张回到90多,另一张也有60多吧。发现显存温度从原来的108度降频,降到了104到106度,在南方初夏的气温条件。总的来说,有点失望,只有一点点提升。

很快到了618,数字货币经过五月中下旬的下跌,发现京东上有一些显卡的现货,于是先后一个多星期的时间买两张华硕的3080TUF显卡,同时也陆续买入显卡延长插槽和开放式显卡框架。自己将四张显卡放到一边的架子运算挖矿,通过延长插槽连到原来的机箱。当组装完这样的配置很快就发现了问题,它会突然死机,一开始半天才死机,然后几个小时,最后不到一个小时就死机。当时,没有立即就发现这点,觉得是网络不稳定,连不上网络的问题,买了无线网上天线与卡槽,连上我前两年买的无线网卡,但解决不了问题。无奈,只好远程控制智能排插的开头,慢慢通过排除法找到问题所有。六月末那时,发现了只用HP的OEM显卡,即使超频也可以稳定运算,但是如果用华硕的显卡,但可以半个小时就死机,当时觉得两张华硕显卡都有问题,于是前后一个星期的时间寄回商家返厂检测维修,回复说都滑检测出问题,其中一张还换了货,回来还是老样子。

在检测期间,发现两张HP显卡即使改装了水冷套装后还是会慢慢地上升,最后到了94-98度。觉得显存温度也是导致死机问题但还未排除的一个因素。先把其中一张华硕显卡改装为水冷套装,曾经通过运行特定版本的Gminer可以顺利运行差不多两天。但发现即使改了水冷,华硕的显卡的温度还是上升很快,只能保持在92度左右。后来想到了我买的是以3090的显卡结构为基础的但是3090是双面都有显存,所有背面的显存没办法挤压得那么紧密。原来是想给之前三个水冷套装重新换背面的散热贴,然后发现有更厚的散热贴,就买了3mm。不久最后一张显卡也寄过来,就陆续把它们的背板散热贴都换成3mm,改完之后,显卡的PCB板有些变形,向正面凸起,让显存、导热贴、散热模块更紧密。结果,这点改装的努力产生了作用,一开始显存温度维持在80度左右,到现在仲夏最热时,也能保持90度左右。

但是,让人沮丧的是,即使将显存温度控制在80-90度,但是会出现死机的现象,这让我有了与去年修电脑时的感觉(《一次时间最长的维修笔记本电脑经历》提到)。自己,冷静下来,重新再鼓励自己,慢慢想,既然显卡排除,系统也排除,那就从软件入手。自己比较喜欢用Gminer,可以配置很多参数,然后换了Bminer、PhoenixMiner发现还是会出现问题。到这个地步只再看看国外的讲坛怎么说,国内最多提到显存温度,轻松矿工那里提到了虚拟内存、杀毒软件的问题,但可以排除,还是因为只用HP两张显卡可以挖很久。于是最后经过细心的查找发现了Riser的问题,有人提到显卡用的插槽问题。于是,我也想到,有一段时间我试过四显卡可同时挖矿,那里没有装到显卡框架里,那时只有一张卡用PCIE16插槽,其它都是用PCIE1插槽。于是更换的插槽位,结果也有些进展,可以稳定运行一天半左右。还有一个问题是我第四个延长插槽跟另外三个不是同一个店买的,所以当时可运行三显卡挖矿也可能是这个原因。

最后补了同一店家的显卡延长插槽,这样四个显卡用的延长插槽都是一致,最终可以让四张显卡同时在南方的夏天控制温度,超频显存稳定地运行挖矿软件。