当前位置:首页 > 企业新闻
从TegraK1和Denver,看那些年我们一直误会的NVIDIACPU
时间:2020-11-07 来源:BG真人 浏览量 35063 次
本文摘要:拒绝NVIDIA,可能99%的朋友的第一反应是显示卡和GPU。

拒绝NVIDIA,可能99%的朋友的第一反应是显示卡和GPU。世界上两大GPU巨头之一,GPU领域意味着的霸主,地球人前几天刚刚发表了新的Turing结构和RTX大门2080Ti/2080/2070显示卡。这只是没有问题的,近年来,人们在NVIDIATGPU发麻的同时,冥冥中可能忽视了什么。

NVIDIA的GPU不强吗?显然很强,爆炸很强,无论是PC末端还是SoC,都很清楚……emm,然后呢?不久前,我看到了这样一张场上主流SoC的详细总结,生动的形象似乎很容易理解。但是,看到最后一后一个时候,我立刻意识到人们以前忽略了什么:NVIDIA系统中央处理器怎么样?你知道它像图片上的那样吗?CPU敢吗?这实质上是NVIDIA不知道SoC的设计,迄今为止发表了7代Tegra系列SoC。

NVIDIA仍在TegraSoC中用于家庭GPU结构,但前几代CPU部分使用Arm公共CPU核心。与同时期的高吞吐量三星联发科处理器相比,除了祖传的GPU以外,没有其他引人注目的地方。

推倒也有很多手机和平板电脑用于Tegra处理器,算数也很差。但是,即使时间停止了,NVIDIA,SoC中的CPU可能也不知道有什么缺点。必须说的是,知道NVIDIA黄教主是否是苹果乔主的铁棒粉丝,这几代Tegra没有构筑neon协助处理器,flash播放能力很好。Arm公共版CPU核心不受骗,同时三星华为联发科德克萨斯仪器也是公共版核心。

BG真人

此外,NVIDIA在CPU中的野心和实力远不如人们的固有印象。在2011年的CES中,NVIDIA发表了Denver计划,宣布开发基于64位Arm3v8命令集的自我研究结构,用于从移动设备到服务器等各种设备。仅仅3年后的2014年CES,NVIDIA就发售了自己研究Denver架构的TegraK1,成为时隔苹果发表的第二家基于Armv8命令集的消费级SoC公司。

时间重设4个月,2013年9月,苹果在A7处理器上意外地用于基于Armv8指令集的Cyclone架构。在接下来的一年多里,基于Armv7命令集的Cortex、A15公共版架构和高吞吐量Krait吐量Krait的自我研究结构,还包括基于Armv8指令集的CortexA57,其他同时期的CPU结构都被Cyclone夺走了。除了Denver。传统的CPU结构设计分为顺序继续执行和随机执行两种。

正如其名称所示,顺序继续执行系统严格按接管顺序继续执行微指令,但随机执行系统允许在不改变指令运算结果的前提下调整继续执行顺序。迄今为止,混乱执行被指出是顺序继续发展到无限大后的进化。

CPU继续执行的任务复杂,在某些情况下,RAM等周边部件不会堵塞命令的顺序继续执行。此时,随机执行后,可以明显改善计算的灵活性,有效提高吞吐量。

在至今为止(公共编号:)ArmCortexA76和三星Exynos的M3结构的文章中,混乱执行一次又一次地被提及,在这些高性能Arm的核心中,混乱执行可能已经成为二的自由选择。但是,要更换乱序执行,必须设置乱序执行窗口,有效识别新的顺序命令,保证命令安全的乱序执行,这似乎不会提高结构的复杂性,芯片尺寸和功耗显着下降。NVIDIA在提高结构性能方面开辟了新的道路,指出乱序执行不是解决问题的唯一方法。Denver不仅知道退出Arm公开版的高性能结构中的主流乱序执行方式,还使用低功耗处理器的罕见顺序继续执行,配合高效的二进制翻译和代码优化方案。

NVIDIA的想法非常简单:顺序继续执行系统面临的基本问题具体,内存衰退等硬件问题和指令顺序不当等软件问题都没有。那么,这些问题必须变成结构体系吗?你能在硬水平中解决问题吗?这就是Denver的核心思想。这个结构不奇怪Denver的内部命令形式与ARMv7或ARMv8大不相同。在明确的内部结构中,Denver用于GPU中非常罕见的VLIW(VLIW)格式继续执行命令(NVIDIA)。

在结构的前端,Denver的命令解码宽度超过了前所未有的7个上升空间,比Cortex-A15(3个上升空间)、Cortex-A57(4个上升空间)和苹果Cyclone(6个上升空间)长。NVIDIA正式被称为7结构,其中美是指NVIDIA为Denver设计的DCO(动态代码优化器)。DCO的任务是将Arm代码切换成Denver的原始形式,优化该代码,使Denver更好地运营。

对于整个CPU来说,DCO是最重要的环节,其性能需要DCO的要求。长期以来,有传言称Denver最初的设计意图射击的是x86,其基础设计和二进制翻译为机制目的,在不侵犯x86专利的前提下继续执行相容x86指令。无论这个传闻是否知道,最后NVIDIA在软水平上取得了难以置信的成果,构筑了可以分离硬件设计和命令集的结构。

但是,尽管DCO如此逆转,NVIDIA还是在其外面设置了Arm命令解码器。官方应对这个Arm解码器不是备用轮胎,但实际上似乎是讨厌体强,Denver的指令大部分来自二进制翻译,这个Arm解码器只有区域2指令宽度(CortexA8级),二进制翻译不能高效处理的情况下与此同时,由于NVIDIA自由选择了解决硬水平问题的方法,Denver也享有其他结构没有的升级性,如果DCO改良,NVIDIA可以进一步部署新版本的DCO。最后Denver的实际性能也不足以用技术愤怒来表现。在SPECint2000测试中,Denver与CortexA15相比平均上升了35%,最低上升幅度达到了67%。

Denver核心的Tegrak1性能几乎超过了同时期Cyclone核心的苹果A7,与IntelHaswell核心的比赛扬2955U相比,相互来回。醉汉的意思不是酒,也许有朋友不会困惑。

NVIDIA和SoC的CPU不仅不弱,而且和GPU一样没有爆炸性强的存在。为什么NVIDIA在手机和平板电脑领域仍然无法解散,最后只是解散了?非常简单,因为人们明显不想争夺这个……和我们热闹的普通用户不同,NVIDIA确实不能再做自己的SoC情况了。作为刚入局的新人,在基带、底包、SDK、节能消耗等方面处于天秤座的劣势,与市场上销售的根深蒂固的老黄牛合力是不明智的。德克萨斯的仪器在2014年解散了手机SoC的领域,Tegra计算了第4代对美国3的使用也计算了善始善终,交给了朋友……NVIDIA看到了SoC更好的应用领域-AI等高性能的移动计算平台经历了TegraK1和Tegrax1的过渡性,TegraParker(NVIDIADrivePX)带着改良版的Denver2结构顺利登上了自动驾驶的舞台。

今年刚上市的NVIDIAJetsonXavier平台,给没有朋友的自我研究结构Carmel带来了强烈的指令解码,超过了惊人的10宽,在Denver的基础上再次前进。现在的AI芯片领域执着于AI运算的简化设计时,NVIDIA是唯一没有退出高性能CPU的家庭,也是平衡CPU、GPU、AI三部分的最差家庭。So,老铁们,NVIDIACPU敢带GPI,NVIDIA知道不是CPU的差距,而是太强了,强度远远超过了我们熟悉的维度……原创文章允许禁止发表。

下一篇文章发表了注意事项。


本文关键词:BG真人,BG真人登录

本文来源:BG真人-www.woodgridcofferedceilings.com

版权所有阿里地区BG真人 科技有限公司 藏ICP备96062880号-3

公司地址: 西藏自治区阿里地区石屏县支展大楼61号 联系电话:070-54239929

Copyright © 2018 Corporation,All Rights Reserved.

熊猫生活志熊猫生活志微信公众号
成都鑫华成都鑫华微信公众号