DeepSeek预备适配国产GPU,绕开英伟达CUDA
DeepSeek要适配国产GPU了?这确切是年夜坏事一件。据报道,DeepSeek在研发年夜模子时绕过了英伟达的护城河CUDA,这象征着能够直接依据GPU的驱动函数做一些新的开辟,从而实现愈加细粒度的操纵。比方DeepSeek在多节点通讯时绕过了 CUDA 直接应用 PTX(Parallel Thread Execution),其最多只能实现以算法的方法来高效应用硬件层面的减速。一旦速率变得更快,打个比喻这就象征着他人家的模子要练习十天,而DeepSeek只要要练习五天,那么就能给模子喂更多的数据,即能让模子在等同时光内看到更多的数据,直接进步模子的后果。依照新闻人士的说法,DeepSeek领有一些善于写PTX言语的外部开辟者。那么,如果它之后应用国产GPU,其在硬件适配方面将会更随心所欲,其只有懂得这些硬件驱动供给的一些基础函数接口,就能够模仿英伟达GPU硬件的编程接口去写相干的代码,从而让自家年夜模子愈加轻易适配国产硬件。