抖du圈

CN EN JP
企业邮箱入口
关注抖du圈智能把握最新行业动态与资讯
当前地位:首页 >  新闻中心 >  公司新闻

从CPU、GPU到NPU, ,,, ,,抖du圈智能持续优化异构算力推算效力

颁布日期:2025-11-22 接见量:1824 起源:抖du圈智能

AI算力已成为数字经济时期的主题出产力, ,,, ,,但全球AI产业正面对“供给不及、成本高企、生态待建”三沉挑战。。。。。。。据行业统计, ,,, ,,行业算力资源均匀利用率仅为30%~40%, ,,, ,,存在严沉的算力浪费景象。。。。。。。国内当先的科技企业也在近期暗示, ,,, ,,将通过软件层创新大幅提升算力资源利用率。。。。。。。

作为高算力AI模组和端侧AI领域确当先企业, ,,, ,,抖du圈智能持久专一于端侧AI算力的优化与提升, ,,, ,,通过深耕SoC架构、容器化和虚构化、内存带宽压缩、算法量化、电源战术优化等关键技术, ,,, ,,抖du圈智能在端侧AI领域形成了怪异的“软件+硬件”协同优势, ,,, ,,为提升AI算力利用率提供了一整套齐全规划

1.jpg

优化SoC架构调度:引发 CPU + GPU + NPU 算力协同潜能

异构推算架构是现代SoC芯片的主题优势。。。。。。。抖du圈智能多年深耕SoC架构, ,,, ,,通过软硬协同优化最大化利用平台AI算力, ,,, ,,充分阐扬每个处置器的怪异优势:CPU善于挨次节造和通用工作, ,,, ,,GPU适归并行数据流处置, ,,, ,,而NPU则专精于标量、向量和张量数学运算, ,,, ,,是AI工作负载的主题执行单元。。。。。。。


2.jpg

抖du圈智能具备当先的SoC集成开发、机能调度和智能化系统研发能力, ,,, ,,并堆集了丰硕的高算力AI利用和虚构化经验。。。。。。。针对AI算法利用特点, ,,, ,,抖du圈智能进行了针对性的大型算法调度和多算法并行调整。。。。。。。

? 在大型算法调度方面:通过将大型算法拆分与并行处置, ,,, ,,将复杂AI算法拆解成多个部门, ,,, ,,凭据CPU、GPU、NPU的算力个性, ,,, ,,别离加载分歧部门至相应处置器, ,,, ,,基于流水线作业实现算力并行和多算法负载平衡。。。。。。。

? 在多算法并行调整方面:凭据各个算法对算力的分歧需要, ,,, ,,合理分配算法到最相宜的处置器上运行, ,,, ,,预防资源争抢和闲置, ,,, ,,从而实现算力资源的充分利用。。。。。。。

突破内存墙瓶颈:以压缩与量化技术提升推算效能

内存带宽压缩技术通过在有限内存带宽下互换更无数据, ,,, ,,显著降低了内存接见瓶颈对算力阐扬的影响。。。。。。。该技术利用LPDDR5X内存提供超过120GB/s的带宽, ,,, ,,满足7B模型推理时的高吞吐需要。。。。。。。


算法量化技术基于量化感知的混合量化规划, ,,, ,,部门层使用INT4精度, ,,, ,,在精度损失可控的情况下进一步降低推算开销, ,,, ,,提升处置速度。。。。。。。具体实现蕴含:

? 混合精怀抱化:抖du圈智能支持INT4/FP8混合精度推算, ,,, ,,与DeepSeek-R1模型的量化体式高度适配。。。。。。。以7B参数模型为例, ,,, ,,经INT4量化后, ,,, ,,模型体积从FP32所需的28GB压缩至仅2-4GB, ,,, ,,大幅降低存储和内存占用。。。。。。。

? 量化感知训练(QAT):在模型训练过程中插入伪量化节点模拟量化成效, ,,, ,,使模型在训练阶段即适应低精度推算, ,,, ,,显著削减量化后的精度损失。。。。。。。

? 训练后量化(PTQ):使用少量校准数据估计权沉和激活值的动态领域, ,,, ,,确定量化参数, ,,, ,,无需沉新训练即可实现模型压缩, ,,, ,,适配周期缩短50%。。。。。。。


3.jpg

强化电源与散热设计:为高算力持续输出保驾护航

除了推算和内存优化, ,,, ,,电源治理和散热设计同样直接影响算力利用率的不变性和持续性。。。。。。。抖du圈智能通过多维度创新确保端侧设备在功耗约束下维持不变机能。。。。。。。

在电源治理方面:

? 精密化功耗调度:模组内置的电源治理芯片(PMIC)可对SoC上分歧推算单元(CPU/GPU/NPU)的供电进行独立监控和动态调节。。。。。。。系统会凭据实时算力需要, ,,, ,,智能调整各单元的工作电压和频率(DVFS技术), ,,, ,,在满足机能需要的同时, ,,, ,,将整体功耗降至最低。。。。。。。

? 分级供电与智能待机:模组为处置器、内存及通讯单元提供了独立的供电域。。。。。。。在低负载场景下, ,,, ,,可自动关关非必要职能单元的供电, ,,, ,,或使其进入低功耗休眠状态, ,,, ,,显著降低待机功耗, ,,, ,,这对于依赖电池供电的移动设备至关沉要。。。。。。。

在散扰着化方面:

? SIP系统级封装与Underfill工艺:在高端车规级模组中, ,,, ,,抖du圈智能选取SIP(系统级封装)技术, ,,, ,,将多颗芯片高密度集成。。。。。。。通过引入Underfill(底部填充)工艺, ,,, ,,在芯片与基板间填充特殊配方的胶水, ,,, ,,这不仅显著加强了模组在振动、冷热冲击环境下的机械靠得住性, ,,, ,,其填充资料自身也成为了辅助芯片散热的沉要蹊径, ,,, ,,能将热量更均匀地传导至模组基板, ,,, ,,优化整体散热机能。。。。。。。

? 一体化散扰纂结构优化:抖du圈智能的高算力AI模组(如AI算力盒子)选取一体散热设计, ,,, ,,确保在长功夫持续运行下机能不变。。。。。。。在结构上, ,,, ,,通过优化模组内部布局和选取高热导率资料, ,,, ,,打造高效热传导蹊径。。。。。。。例如, ,,, ,,部门模组会集成屏蔽罩或散热盖板, ,,, ,,与芯片表表缜密贴合, ,,, ,,充任“导热桥”, ,,, ,,将热量急剧导向模组表壳或设备的表部散热系统。。。。。。。


推动端侧落地:以全场景AI模组赋能行业智能化升级


抖du圈智能的技术理想不仅停顿在理论层面, ,,, ,,更通过一系列产品落地和现实用例实现了端侧AI算力的高效利用, ,,, ,,通过专一于端侧AI算力的优化与提升, ,,, ,,形成了自己怪异的竞争优势。。。。。。。


抖du圈智能的高算力AI模组产品涵盖入门级、中端、旗舰级多档次, ,,, ,,对应AI算力覆盖0.2TOPS-100TOPS, ,,, ,,可能在各类边缘推算终端、机械人、智能汽车域节造器等设备上执行多种类型的端侧推算工作。。。。。。。这种全面布局使得抖du圈智能可能凭据分歧的利用场景需要, ,,, ,,提供最相宜的算力解决规划, ,,, ,,预防“过度配置”或“配置不及”造成的算力浪费。。。。。。。


4.jpg


抖du圈智能在5G与AI融合方面也有深刻布局, ,,, ,,其推出的5G-A+Wi-Fi 7双擎传输规划支持万兆速度与智能天线阵列, ,,, ,,为端侧AI利用提供了高速、低延长的衔接保险。。。。。。。通过“本地AI引擎+云端大模型”双轨架构, ,,, ,,抖du圈智能实现了从设备层到利用层的全栈智能化升级, ,,, ,,这种端云协同架构既利用了端侧算力的高效性, ,,, ,,又保留了云端算力的无限扩大性。。。。。。。


在人形机械人、智能座舱、无人机、智能安防、智能家居等场景中, ,,, ,,高效的端侧算力在阐扬越来越沉要的作用。。。。。。。将来, ,,, ,,随着AIGC与物联网的进一步融合, ,,, ,,抖du圈智能有望通过其“软件+硬件”协同优化的特色蹊径, ,,, ,,在加快人为智能产业发展的征程中表演更为沉要的角色。。。。。。。

返回列表
分享:

Copyright ? 2019 抖du圈.粤ICP备16017609号

粤公网安备44030402003674号

交谊链接: 交谊链接 | 网站地图

智能客服 抖圈- 为du而生

增长企业客服 增长企业客服
微博 抖圈- 为du而生
0755-83218588 抖圈- 为du而生
TOP

【网站地图】【sitemap】