BSOD mystère et boule de gomme.

Répondre
Partager Rechercher
Matos : p55a-ud5 / i7 860 / 4× 2GB ripjaws 1600 cas7

Hello,
Il m'arrive un mystère, et c'est grâce à votre aide, amis détectives, que nous allons résoudre cette énigme.

Je pose le background : EDF est parfois capricieux chez moi, et malgré onduleurs et régulateurs de tension, il m'arrive d'avoir des arret non planifié.
Il y'a quelques semaines, le pc ne voulait boot, et la carte maman est passée sur son 2ème bios (rev F3).

J'ai ce matin décidé de le remettre à jour, en utilisant le bios f13b, dernier en date de mi novembre, mais bêta.

Tout se déroule bien, sauf qu'après 10mn je BSOD avec un code d'erreur peu probant (0x0000 de mémoire).
Après être retourné dans le bios check les settings une première fois, je relance windows et paf, bsod après 10mn, de nouveau (en idle).

Je décide alors de downgrade le bios en rev F12 que je sais stable, car je l'ai utilisé de nombreux mois. Rebelotte, BSOD après 10mn de non utilisation (foobar + Opera + pidgin comme seules app actives).
Je retourne dans le bios et me rends compte que j'avais oublié de régler la bonne tension de la mémoire, 1.6V au lieu de 1.5V. La source de mes problèmes ? Peut être, néanmoins même après avoir réglé ceci, je me reprends un BSOD à 10mn (le timing commence à être récurent).

Je décide alors de lancer seven en mode sans échec, pour determiner s'il s'agit d'un problème logiciel/pilote ou si ça viendrait du matos/bios.

Le mode sans echec ne veut se lancer (j'étais sur ssf4 à ce moment, je n'ai pas vu le message exact). Au lieu de ça, le pc reboot et se lance un mode recovery de seven, que j'accepte. Je laisse tourne le bidule pendant quelques dizaines de minutes, il me donne le résultat : il n'a rien pu faire. Je ne m'attendais pas à mieux.
Néanmoins, cette fois ci le mode sans échec se lance. Je laisse tourner 30mn sans BSOD.

Je décide de retenter l'experience et lance seven en mode normal. Ça fait maintenant 1h10 que je suis dessus sans plantage? J'ai même lancer un OCCT:linpack pour voir : pas de soucis (il tourne toujours).

Des idées ?

*Depuis le step 1, les pilotes de logitech SetPoint ne veulent plus se lancer. Le BSOD intervient même après leur désinstallation totale.
C'est bizarre ... ça me rappelle quelqu'un ce problème là ...
Ah oui ... moi et l'ordi d'un client

Ordinateur dont j'ai fini d'ailleurs par découvrir le mystère ... une barrette de Ram défaillante qui passait tous les tests possibles et imaginables ... sauf que seule et en démarrage à froid ... elle bloquait le système sur Asus P7P55D-E ...
Alors que sur la carte mère d'origine elle ne faisait que faire des BSoD une fois sur 2 au démarrage ...

Et pour la question qui te vient au bord des lèvres ...
Oui c'est possible qu'une barrette lâche comme ça ... le PC de mon client tournait depuis 1 ans et des brouettes sans aucun soucis !

Ahhh l'informatique et ses mystères

(PS: j'avais même les symptômes identiques avec les SetPoint ... pour te dire)

[Edit] Question con : t'as vérifié que le mode de fonctionnement Sata n'avait pas sauté avec le passage au nouveau bios ... parce que même si Seven est capable de réinstaller les pilotes à la voler ... le passage du mode Sata au mode IDE n'est guère apprécié de ce dernier :/
J'ai pu réinstaller mon setpoint. Je ferai la chasse à la barrette défaillante une prochaine fois, pas le temps.
Merci de la piste en tout cas, je ferai un retour si c'est ça / si c'est autre chose.
Souvent pour les problèmes aléatoires et incompréhensibles, je fini par regarder du côté de l'alimentation.

Après, n'importe quel composant du cœur, surtout la mémoire en effet, peut-être impliqué. Tout particulièrement si tu tripatouilles le voltage des composants.
Piste : malgré le fait que j'ai bien reconfig le bios, certains settings n'étaient pas pris en compte jusqu'à ce que je retourne dedans.
Le settings que j'ai pu entendre : l'auto-régulation des ventilo CPU.

Hors, par défaut, la MB auto o/c la mémoire. Ça peut provenir de ça.
Pas de nouveau BSOD depuis dimanche.

J'ai regarder les logs, j'ai ça comme info :

L’ordinateur a redémarré après une vérification d’erreur. La vérification d’erreur était*: 0x00000124 (0x0000000000000000, 0xfffffa80086a7028, 0x00000000f2000000, 0x000000000020008f). Un vidage a été enregistré dans*: C:\Windows\MEMORY.DMP. ID de rapport : 030611-21013-01.

Additions marrantes :
Le chargement de \SystemRoot\SysWow64\Drivers\StarOpen.SYS a été bloqué en raison d’une incompatibilité avec ce système.

StarOpen n'a jamais été installé, je me demande ce qu'il fait ici.

Application Host Helper Service a rencontré une erreur lors de la tentative d'accès au répertoire de l'historique racine 'C:\inetpub\history'. Le répertoire n'existe pas ou les autorisations définies ne permettent pas au service de l'historique d'y accéder

Je n'ai en effet pas de tel répertoire (juste un .\inetpub\temp). Quelqu'un peut me dire s'il a ?

Par contre ces erreurs sans antérieures aux BSOD, du coup il ni a peut être pas causalité.
Staropen est un driver mis à disposition par rocket div. pour différents outil de gravure (ou autre logiciel avec option gravure de cd/dvd). Sauf qu'aux dernières nouvelles, il a toujours du mal sur le 64 bits.
(et même en x86, c'est parfois du délire ... )

Concernant inetpub, c'est le répertoire standard racine pour IIS. Tu n'as pas installé le serveur http de microsoft, si ?
Merci Sadyre.

Après une semaine sans défaillances, ça recommence ! Je contacte le sav g.skill.

Edit : au cas ou de grands guru windowsiens passent par la, j'attache mes minidump de ce matin :

http://karmina.fr/temp/031411-28002-01.dmp
http://karmina.fr/temp/031411-26956-01.dmp

0x00000124 (0x0000000000000000, 0xfffffa800867b028, 0x00000000f2000000, 0x000000000020008f)

Je ciblerai la barrete incriminé / matériel (alim/gpu/hdd) demain matin si jamais j'ai la chance d'avoir de nouveaux BSOD (vu que c'est super random).
Hors de question que tu lâches eve, ne serait-ce qu'une heure.
Tu as essayé un memtest sur tes barrettes pendant plus de 10 minutes ? Ca crashe ?

As-tu fait un clear CMOS ? Après ton dernier flashage ?
Citation :
Publié par Whinette
J'ai fais tourner 2h ce matin (=2 passes), 0 erreurs, mais ce n'est pas étonnant si on en croit Sinju khai Nobutsu.
Et le clear cmos ? Avec les upgrades/downgrades de bios, ça ne m'étonnerait pas qu'il soit fucked up.
Oui et non. Un clear CMOS est censé se faire lors du flashing du bios (case cochée dans @bios). Je n'en ai pas refais un manuellement par après, mais ce n'est pas con vu mes soucis de settings non pris en compte.

Malheureusement vu que je ne BSOD plus il va être difficile de voir si ça a aidé ou pas.
Par conséquent, je vais attendre de BSOD avant de le faire.
Citation :
Publié par Whinette
Oui et non. Un clear CMOS est censé se faire lors du flashing du bios (case cochée dans @bios). Je n'en ai pas refais un manuellement par après, mais ce n'est pas con vu mes soucis de settings non pris en compte.

Malheureusement vu que je ne BSOD plus il va être difficile de voir si ça a aidé ou pas.
Par conséquent, je vais attendre de BSOD avant de le faire.
Case solved.

Retourne sur Eve maintenant.
Analyse avec un outil trouvé sur un autre fil (who crashed, merci Dez) :
Code:
On Mon 14/03/2011 07:55:14 GMT your computer crashed
crash dump file: C:\Windows\Minidump\031411-26956-01.dmp
This was probably caused by the following module: ntoskrnl.exe (nt+0x15F59) 
Bugcheck code: 0x124 (0x0, 0xFFFFFA800867B028, 0xF2000000, 0x20008F)
Error: WHEA_UNCORRECTABLE_ERROR
file path: C:\Windows\system32\ntoskrnl.exe
product: Microsoft® Windows® Operating System
company: Microsoft Corporation
description: NT Kernel & System
Bug check description: This bug check indicates that a fatal hardware error has occurred. This bug check uses the error data that is provided by the Windows Hardware Error Architecture (WHEA). 
This is likely to be caused by a hardware problem problem. This problem might be caused by a thermal issue. 
The crash took place in the Windows kernel. Possibly this problem is caused by another driver which cannot be identified at this time. 


On Mon 14/03/2011 07:39:25 GMT your computer crashed
crash dump file: C:\Windows\Minidump\031411-28002-01.dmp
This was probably caused by the following module: hal.dll (hal+0x11ED7) 
Bugcheck code: 0x124 (0x0, 0xFFFFFA80086AA028, 0xF2000000, 0x20008F)
Error: WHEA_UNCORRECTABLE_ERROR
file path: C:\Windows\system32\hal.dll
product: Microsoft® Windows® Operating System
company: Microsoft Corporation
description: Hardware Abstraction Layer DLL
Bug check description: This bug check indicates that a fatal hardware error has occurred. This bug check uses the error data that is provided by the Windows Hardware Error Architecture (WHEA). 
This is likely to be caused by a hardware problem problem. This problem might be caused by a thermal issue. 
The crash took place in a standard Microsoft module. Your system configuration may be incorrect. Possibly this problem is caused by another driver on your system which cannot be identified at this time.
C'est surtout un memo pour les sav.
Pour trouver la barrette récalcitrante ...
Faut faire 4 passes de Memtest+ sur chaque barrette indépendemment ... et sur le slot 1 de préférence ...

Mais vu ton erreur WHEA_UNCORRECTABLE_ERROR 0x124 ... qui est une erreur matériel ... si tu as une barrette HS ... c'est pas très étonnant
Ntoskrnl.exe & hal.dll ne sont certainement que des victimes du plantage de la barrette.

Gozmoth ... t'inquiètes il n'arrêtera pas de jouer, même si il a une barrette HS il a 4x2Go ...
Citation :
Publié par Whinette
Un clear CMOS manuel semble avoir corrigé les problèmes. Allez faire confiance aux logiciels.
Je l'avais dit ... T'avais qu'à m'écouter !
Répondre

Connectés sur ce fil

 
1 connecté (0 membre et 1 invité) Afficher la liste détaillée des connectés