Ce site peut gagner des commissions d’affiliation à partir des liens sur cette page. Conditions d’utilisation.

De bonnes données de fiabilité sont à la fois très prisées en informatique et difficiles à trouver. Parfois, une société tierce comme SquareTrade publiera ses propres chiffres, mais ces rapports sont rares. Il est effectivement impossible de suivre l’évolution d’un fabricant d’une année à l’autre sans un ensemble de critères cohérents et un suivi sur plusieurs années. Le revendeur européen Mindfactory a récemment choisi de partager ses données GPU RMA pour les produits AMD par rapport aux produits Nvidia et les résultats sont assez intéressants.

J’ai déjà écrit sur les données de Mindfactory et je suis prêt à les utiliser comme source pour cet article, mais je tiens à noter une mise en garde importante pour laquelle je n’ai pas d’explication. Selon cet ensemble de données, Mindfactory a vendu très peu de RTX 2070 et 2080, et n’a expédié qu’une poignée de SKU. Je soupçonne que cela implique que les données ne couvrent que les 12 mois précédents. C’est pertinent si nous voulons tirer des conclusions sur l’âge relatif des nœuds de processus sur lesquels ces GPU ont été construits. Le rapport couvre 44.100 GPU AMD et 76.280 GPU Nvidia, et est probablement un échantillon statistiquement significatif de toutes les cartes de canaux de vente au détail vendues par l’une ou l’autre société en Europe pour la période concernée.

Toutes les mises en garde habituelles s’appliquent. Mindfactory est un distributeur européen. Ce n’est pas une entreprise américaine et ses données sont un aperçu de l’ensemble du marché, rien d’autre. Ces résultats ne doivent pas être considérés comme déterminants, ils doivent être lus avec un grain de sel, concours non valable en Alaska ou à Hawaï, aucune participation nécessaire, voir magasin pour plus de détails, etc., etc.

Voici les points à retenir du graphique, sans ordre particulier:

Les GPU moins complexes et moins puissants échouent moins souvent que les GPU plus complexes et plus puissants.Les cartes milieu de gamme et budget d’AMD échouent pas plus souvent que les cartes milieu de gamme et budget de Nvidia.Les GPU PowerColor AMD échouent plus souvent que les autres marques.Le RTX 2080 Ti est le GPU statistiquement le plus susceptible d’échouer. C’est le seul GPU avec des taux d’échec à deux chiffres (11%) signalés par plusieurs fournisseurs.Les GPU haut de gamme AMD échouent plus souvent, en termes absolus, que les GPU Nvidia, même si nous supprimons l’impact de PowerColor sur les données AMD. Cependant, l’écart est nettement plus petit si vous le faites.

Il y a quelques années, un rapport a été publié montrant les taux d’échec entre différents types de RAM. Si quelqu’un peut s’en souvenir, envoyez-moi un lien – je n’ai pas eu de chance pour trouver l’article. Ce qu’il a montré, c’est qu’il était plus courant que les DRAM amateurs haut de gamme échouent que les pièces basiques bas de gamme telles que Kingston ou Crucial. Les taux d’échec ne correspondaient pas parfaitement à l’horloge, mais à mesure que la vitesse d’horloge augmentait, le taux RMA augmentait également. L’article dont je me souviens n’était pas l’étude Google 2009, ni le suivi de 2012, et je ne pense pas non plus que ce soit l’étude Microsoft 2012. Il était basé sur du matériel grand public et non sur une technologie d’entreprise ou de serveur. Le fait était que le matériel pour passionnés fonctionnant près de la marge de ce qui est possible a un taux de défaillance plus élevé que les pièces standard de bog qui sont bien dans les marges d’horloge et de tension.

Nous voyons ici des preuves d’une tendance très similaire. Si nous supposons que ces données couvrent juillet 2019 – juillet 2020, cela signifie que Nvidia avait encore de réels problèmes avec le RTX 2080 Ti lorsque le GPU avait près d’un an, longtemps après que la société ait commencé à expédier la carte. À l’inverse, si l’ensemble de données provient du lancement de Turing, cela signifierait que tout ce qu’il fait est de capturer le taux d’échec de lancement déjà connu pour le RTX 2080 Ti.

J’aurais aimé avoir plus de données sur les RTX 2070 et 2080, car les données limitées dont nous disposons suggèrent des taux de rendement élevés sur les cartes Gainward pour les cartes RTX 2080 et KFA2 pour le RTX 2070. Les RTX 2070 Super et RTX 2080 Super reviennent les tarifs sont excellents. Sont-ils excellents parce que Nvidia a eu des mois pour affiner Turing, ou étaient-ils excellents depuis le début? La réponse à cette question aurait un impact significatif sur la façon dont nous interprétons les taux RMA plus élevés d’AMD étant donné que les 5700 XT et 5700 ont été lancés sur un tout nouveau processus 7 nm.

Le fait que nous voyons une tendance à la baisse des taux d’échec sur les GPU plus simples et plus petits des deux sociétés est très probablement pertinent. Le taux d’échec plus élevé du RTX 2080 Ti correspond à cela – la puce était un réticule-buster qui a poussé l’ingénierie à sa limite. En ce qui concerne les différents taux d’échec des fabricants, nous n’avons que des questions. Pourquoi le Gaming Z Trio RTX 2080 Ti de MSI a-t-il un taux d’échec de 1% avec 2 retours (~ 200 GPU vendus), alors que le MSI Lightning Z avait un taux d’échec de 11% avec 14 retours (~ 130 GPU vendus)?

Une variation drastique des taux d’échec du GPU pourrait impliquer les pratiques de refroidissement du fabricant ou refléter le fait qu’une entreprise a introduit de nouveaux modèles de GPU au cours d’une année et que ces dernières cartes échouaient moins souvent. Des taux d’échec plus élevés sur les cartes AMD pourraient refléter le fait qu’AMD pousse ses GPU plus près du bord de la stabilité ou que les partenaires OEM d’AMD sont prêts à utiliser le bord irrégulier un peu plus près sur les cartes AMD que sur Nvidia car Nvidia a plus d’autorité et d’opportunités pour jouer au hardball (et exiger que ses GPU soient correctement pris en charge). L’une des raisons pour lesquelles les cartes mères AMD étaient historiquement moins fiables que les cartes Intel était qu’AMD ne pouvait ni forcer VIA à corriger ses bogues (comme le tristement célèbre problème de Southbridge KT133A) ni exiger des fournisseurs de cartes mères qu’ils consacrent autant de temps au débogage et à l’amélioration des BIOS des cartes mères AMD. car ils étaient prêts à investir dans les cartes Intel. Une dynamique similaire pourrait-elle être à l’œuvre ici? Il pourrait être. Le fait est que nous ne savons pas. Aucun GPU Sapphire n’a plus de 2% de taux d’échec et 2% correspond à n’importe quelle carte Nvidia. Est-ce donc un problème AMD ou un problème PowerColor – mais si nous disons que c’est un problème PowerColor, le 2080 Ti était-il un problème multi-fabricant ou quelque chose de spécifique à Nvidia?

C’est pourquoi les fabricants n’aiment pas publier des données de qualité. Les questions engendrent des questions engendrent des questions. Même si nous connaissions la période pertinente, nous ne saurions pas quand les GPU vendus par Mindfactory ont été réellement fabriqués. Peut-être que le détaillant a reçu un gros lot de GPU initiaux de toutes sortes qui ont échoué et que tous les taux d’échec aujourd’hui sont fondamentalement égaux (1 à 2%) entre toutes les cartes et les fabricants. Peut-être que les taux d’échec ont augmenté récemment parce que le COVID-19 a tué le contrôle de la qualité et que les entreprises ne font que pomper tout ce qu’elles peuvent vendre. Sans plus d’informations, nous ne pouvons pas savoir – et c’est ce «plus d’informations» que les entreprises ne veulent pas transmettre en premier lieu.

Maintenant lis: