We are in the process of migrating this forum. A new space will be available soon. We are sorry for the inconvenience.

Problem mit Prozessor Taktrate (extrem! niedrig)


axi92
16.12.15, 10:31
Ok mein Kühler wurde ausgetauscht läuft alles wieder

axi92
16.12.15, 08:40
Ja ich habe dem Support jz eine genaue Anleitung geschrieben^^

Jetzt ist er draufgekommen das der CPU heruntertaktet und er nun einen "cooling test" durchführt.
Sind leider alles dinge die mir eh schon alle bekannt sind und die ich auch schon im ticket geschrieben habe xD
Mal abwarten was der Test jetzt zeigt.
Der Support wird mit dem Forum hier nicht viel anfangen da ich mit ihm auf Englisch kommuniziere.

J-B
16.12.15, 08:30
Im vergleich wie es bei mir aussieht, OVH Server:

coretemp-isa-0000
Adapter: ISA adapter
Physical id 0: +34.0°C (high = +88.0°C, crit = +98.0°C)
Core 0: +34.0°C (high = +88.0°C, crit = +98.0°C)
Core 1: +34.0°C (high = +88.0°C, crit = +98.0°C)
Core 2: +34.0°C (high = +88.0°C, crit = +98.0°C)
Core 3: +34.0°C (high = +88.0°C, crit = +98.0°C)
Vielleicht sendest du dem Support den Link hier zum Forum und machst den klar, dass die CPU Temp. viel zu hoch ist.

By the way ...

Im Kernel Log sollte doch auch was stehen, wenn die CPU Temp. zu warm wird?!

axi92
16.12.15, 06:14
Habe diese Mail vom Support gestern erhalten nachdem er den server durchgetestet hat.

Im Betreff stand als Tag [Weiterverfolgung]
Guten Tag,

am 2015-12-15 19:17:09 haben wir einen Fehler auf Ihrem Server entdeckt und
daraufhin einen Eingriff programmiert, um diesen Fehler zu beheben.

Am 2015-12-15 19:43:04 konnte unser Monitoringsystem jedoch keinen Fehler
mehr auf Ihrem dedizierten Server feststellen.

Wir haben deshalb auf Ihrem Server keinen Eingriff durchgeführt. Wir
kennen die Ursache des darauf aufgetretenen Problems nicht.

Der programmierte Eingriff wurde von unserer Liste gelöscht.

Logs:
----------------------
PING XXXX from 213.186.33.13 : 56(84) bytes
of data.
From 213.186.33.13: Host is alive
From 213.186.33.13: Host is alive
From 213.186.33.13: Host is alive

--- ping statistics ---
10 packets transmitted, 10 packets received, 0 errors,
0% packet loss
Bedeutet das ich kann ihn wieder normal hochfahren und nutzen?


Edit: Hab im rescue web interface den prozessortest gestartet und mich dann per ssh eingeloggt.
Alle kerne auf 100% und die Temperaturen ALLER!!! Kerne auf exakt 105°C ist das ein bug?

Edit2:
Ok nachdem ich den Prozessortest gestoppt habe fällt die temperatur nach 30 sek wieder auf 85°C

Edit3:
Nach 10 Minuten Leerlauf ist er immer noch auf 85°C das ist doch schon ein Anzeichen das was nicht stimmt mit der Abfuhr der Wärme.
Muss ich jetzt dem Support genau erklären wie er die Tests machen muss oder wie?


PS: Nach Deutschland möchte ich nicht anrufen wohne in Österreich...

axi92
15.12.15, 18:06
Ok auf den Betreff "Prozessor Temperatur zu hoch, möglicher Lüfter Ausfall" im Ticket dauert die Antwort nur noch 1h =)

Server wird jz in RescueMode gesetzt und der Support meinte er führt tests damit durch
http://help.ovh.com/RescueMode

Jetzt wo ich den Gameserver gestoppt habe ist er dann langsam auf 80°C abgekühlt

maxs97
15.12.15, 17:37
Meines Wissens nach ist das auch so.
Bei mir war mal der Kühler verstopft, was natürlich den Durchfluss behindert.
Temps sind dann so auf 80 Grad angestiegen. 103 Grad sind aber auch schon extrem.
Da sollte sich der Server sowieso bald abschalten um die Hardware zu schützen. Je nach CPU hätte er das auch schon längst getan.

Gruß

Janko
15.12.15, 17:06
dachte die haben alle Wasserkühlung?!

gentlemon
15.12.15, 16:38
Direkt beim Support anrufen, die sollen den Server checken. ASAP.

Ticket erstellen mit den Temps und Ticketnummer an die weiter geben nicht vergessen.

axi92
15.12.15, 16:12
Das ist irgendwie besorgniseregend:

Code:
acpitz-virtual-0
Adapter: Virtual device
temp1:        +27.8°C  (crit = +106.0°C)
temp2:        +29.8°C  (crit = +106.0°C)

coretemp-isa-0000
Adapter: ISA adapter
Physical id 0: +103.0°C  (high = +85.0°C, crit = +105.0°C)  ALARM (CRIT)
Core 0:        +101.0°C  (high = +85.0°C, crit = +105.0°C)  ALARM (CRIT)
Core 1:        +102.0°C  (high = +85.0°C, crit = +105.0°C)  ALARM (CRIT)
Core 2:        +101.0°C  (high = +85.0°C, crit = +105.0°C)  ALARM (CRIT)
Core 3:        +103.0°C  (high = +85.0°C, crit = +105.0°C)  ALARM (CRIT)
Ist da ein lüfter ausgefallen?
Kann ich die Lüftergeschwindigkeiten auslesen?

J-B
15.12.15, 13:34
Zitat Zitat von axi92
Wie überprüfe ich die? Hab mich damit noch nicht beschäftigt
http://blog.mynotiz.de/tutorials/lin...auslesen-2235/

axi92
15.12.15, 13:27
Zitat Zitat von EvilMoe
Schon mal die Temperatur überprüft vom CPU? Kann sein das er auch deswegen runtergetaktet wird.
Der Kernel würde sonst nie die Taktrate soweit runtersetzten das eine Anwendung ausgebremst wird (powersave mal abgesehen).
Wie überprüfe ich die? Hab mich damit noch nicht beschäftigt

EvilMoe
15.12.15, 13:00
Schon mal die Temperatur überprüft vom CPU? Kann sein das er auch deswegen runtergetaktet wird.
Der Kernel würde sonst nie die Taktrate soweit runtersetzten das eine Anwendung ausgebremst wird (powersave mal abgesehen).

gentlemon
15.12.15, 08:36
Die ist sofort wirksam.

axi92
15.12.15, 08:21
Ok danke werde ich versuchen.
Ist die Änderung gleich wirksam?

gentlemon
15.12.15, 07:45
Scheint als sei das das CPU Frequency Scaling.



Sieht bei mir mit ondemand Settings so aus (Ubuntu):

Es könnte auch powersave als Governor vorhanden sein, kommt auf das System an.

Verfügbare Governors findest du mit:
Code:
cat /sys/devices/system/cpu/cpu0/cpufreq/scaling_available_governors
Code:
# grep -E '^model name|^cpu MHz' /proc/cpuinfo
model name      : Intel(R) Atom(TM) CPU N2800   @ 1.86GHz
cpu MHz         : 798.000
model name      : Intel(R) Atom(TM) CPU N2800   @ 1.86GHz
cpu MHz         : 798.000
model name      : Intel(R) Atom(TM) CPU N2800   @ 1.86GHz
cpu MHz         : 798.000
model name      : Intel(R) Atom(TM) CPU N2800   @ 1.86GHz
cpu MHz         : 798.000

Code:
# cat /sys/devices/system/cpu/cpu*/cpufreq/scaling_governor
ondemand
ondemand
ondemand
ondemand

Schau mal ob das bei dir auf ondemand gestellt ist. (pro Kern / Thread einmal vorhanden)

Falls ja, entscheidet Linux selbst, wie die die Taktung aussehen soll.

Kannst du auch dauerhaft auf volle Taktung stellen indem du es auf performance stellst. Entweder jede Datei einzeln editieren oder kurz das hier durchlaufen lassen:

Code:
for CPUFREQ in /sys/devices/system/cpu/cpu*/cpufreq/scaling_governor; do [ -f $CPUFREQ ] || continue; echo -n performance > $CPUFREQ; done

Sieht dann danach so aus:

Code:
# cat /sys/devices/system/cpu/cpu*/cpufreq/scaling_governor
performance
performance
performance
performance
Code:
# grep -E '^model name|^cpu MHz' /proc/cpuinfo
model name      : Intel(R) Atom(TM) CPU N2800   @ 1.86GHz
cpu MHz         : 1862.000
model name      : Intel(R) Atom(TM) CPU N2800   @ 1.86GHz
cpu MHz         : 1862.000
model name      : Intel(R) Atom(TM) CPU N2800   @ 1.86GHz
cpu MHz         : 1862.000
model name      : Intel(R) Atom(TM) CPU N2800   @ 1.86GHz
cpu MHz         : 1862.000
Wie man sieht, dauerhaft auf 1862Mhz statt 798Mhz.


Genaue Infos dazu gibt es heir: https://www.kernel.org/doc/Documenta.../governors.txt

axi92
15.12.15, 06:29
Ich habe am 11.12.15 schon ein Ticket (1497443) eröffnet, leider blieb das noch unbeantwortet darum versuche ich es hier.

Ich habe im Monitoring folgendes stehen:

Intel(R) Xeon(R) CPU E3-1225 V2 @ 3.20GHz
Anzahl : 4
Cache : 8192 KB
Geschwindigkeit : 224 MHz <------

Auch wenn ich über Putty die Taktrate prüfe zeigt er mir an das es sehr stark schwankt .
Das macht es unmöglich den Gameserver welcher läuft mit Stabiler Server Frame Rate laufen zu lassen.
Der Server läuft seit über einem Jahr super und vor 2 Wochen sind diese Probleme aufgetreten.

Bin auch gerade am protokollieren:
Code:
2015-12-14-20:10:01		CPU1: 1728.000; CPU2: 1696.000; CPU3: 1696.000; CPU4: 1696.000; 
2015-12-14-20:20:01		CPU1: 800.000; CPU2: 800.000; CPU3: 768.000; CPU4: 800.000; 
2015-12-14-20:30:02		CPU1: 224.000; CPU2: 224.000; CPU3: 224.000; CPU4: 224.000; 
2015-12-14-20:40:01		CPU1: 2432.000; CPU2: 2400.000; CPU3: 2400.000; CPU4: 2368.000; 
2015-12-14-20:50:01		CPU1: 1376.000; CPU2: 1216.000; CPU3: 1376.000; CPU4: 1216.000; 
2015-12-14-21:00:01		CPU1: 1184.000; CPU2: 1184.000; CPU3: 1184.000; CPU4: 1184.000; 
2015-12-14-21:10:01		CPU1: 1600.000; CPU2: 1664.000; CPU3: 1536.000; CPU4: 1664.000; 
2015-12-14-21:20:01		CPU1: 1920.000; CPU2: 1824.000; CPU3: 1824.000; CPU4: 1856.000; 
2015-12-14-21:30:01		CPU1: 3424.000; CPU2: 3520.000; CPU3: 3136.000; CPU4: 3360.000; 
2015-12-14-21:40:01		CPU1: 2592.000; CPU2: 2528.000; CPU3: 2592.000; CPU4: 2336.000; 
2015-12-14-21:50:01		CPU1: 1824.000; CPU2: 1888.000; CPU3: 1888.000; CPU4: 1888.000; 
2015-12-14-22:00:01		CPU1: 2272.000; CPU2: 3040.000; CPU3: 2784.000; CPU4: 2816.000; 
2015-12-14-22:10:01		CPU1: 3136.000; CPU2: 3328.000; CPU3: 2912.000; CPU4: 2784.000; 
2015-12-14-22:20:01		CPU1: 3296.000; CPU2: 3488.000; CPU3: 3424.000; CPU4: 2304.000; 
2015-12-14-22:30:01		CPU1: 3328.000; CPU2: 3328.000; CPU3: 2752.000; CPU4: 2944.000; 
2015-12-14-22:40:01		CPU1: 3264.000; CPU2: 3424.000; CPU3: 3200.000; CPU4: 3232.000; 
2015-12-14-22:50:01		CPU1: 3296.000; CPU2: 3264.000; CPU3: 3040.000; CPU4: 3328.000; 
2015-12-14-23:00:01		CPU1: 3360.000; CPU2: 2912.000; CPU3: 3392.000; CPU4: 2144.000; 
2015-12-14-23:10:01		CPU1: 3328.000; CPU2: 2784.000; CPU3: 3360.000; CPU4: 2656.000; 
2015-12-14-23:20:01		CPU1: 2752.000; CPU2: 3296.000; CPU3: 2944.000; CPU4: 2784.000; 
2015-12-14-23:30:01		CPU1: 3104.000; CPU2: 3392.000; CPU3: 3392.000; CPU4: 2912.000; 
2015-12-14-23:40:01		CPU1: 3424.000; CPU2: 3360.000; CPU3: 2944.000; CPU4: 2432.000; 
2015-12-14-23:50:01		CPU1: 3488.000; CPU2: 3488.000; CPU3: 3392.000; CPU4: 3552.000; 
2015-12-15-00:00:01		CPU1: 2464.000; CPU2: 2592.000; CPU3: 3392.000; CPU4: 3360.000; 
2015-12-15-00:10:01		CPU1: 3360.000; CPU2: 2368.000; CPU3: 3360.000; CPU4: 3328.000; 
2015-12-15-00:20:01		CPU1: 2848.000; CPU2: 3456.000; CPU3: 2592.000; CPU4: 3328.000; 
2015-12-15-00:30:01		CPU1: 3232.000; CPU2: 3296.000; CPU3: 3104.000; CPU4: 2752.000; 
2015-12-15-00:40:01		CPU1: 2880.000; CPU2: 2464.000; CPU3: 2368.000; CPU4: 3264.000; 
2015-12-15-00:50:01		CPU1: 3232.000; CPU2: 3136.000; CPU3: 3232.000; CPU4: 2624.000; 
2015-12-15-01:00:01		CPU1: 3392.000; CPU2: 2688.000; CPU3: 3424.000; CPU4: 2528.000; 
2015-12-15-01:10:01		CPU1: 2496.000; CPU2: 3424.000; CPU3: 3008.000; CPU4: 3264.000; 
2015-12-15-01:20:01		CPU1: 2784.000; CPU2: 3360.000; CPU3: 2112.000; CPU4: 3488.000; 
2015-12-15-01:30:01		CPU1: 2592.000; CPU2: 3296.000; CPU3: 3392.000; CPU4: 3296.000; 
2015-12-15-01:40:01		CPU1: 3392.000; CPU2: 1600.000; CPU3: 1920.000; CPU4: 3136.000; 
2015-12-15-01:50:01		CPU1: 1984.000; CPU2: 3296.000; CPU3: 3296.000; CPU4: 2720.000; 
2015-12-15-02:00:01		CPU1: 2016.000; CPU2: 2432.000; CPU3: 3264.000; CPU4: 3296.000; 
2015-12-15-02:10:01		CPU1: 3104.000; CPU2: 3136.000; CPU3: 3360.000; CPU4: 3360.000; 
2015-12-15-02:20:01		CPU1: 3456.000; CPU2: 3264.000; CPU3: 3360.000; CPU4: 3200.000; 
2015-12-15-02:30:01		CPU1: 3392.000; CPU2: 3392.000; CPU3: 3392.000; CPU4: 3392.000; 
2015-12-15-02:40:01		CPU1: 3232.000; CPU2: 2496.000; CPU3: 3456.000; CPU4: 3392.000; 
2015-12-15-02:50:01		CPU1: 2944.000; CPU2: 2880.000; CPU3: 3360.000; CPU4: 3360.000; 
2015-12-15-03:00:01		CPU1: 3200.000; CPU2: 3456.000; CPU3: 3328.000; CPU4: 2720.000; 
2015-12-15-03:10:01		CPU1: 2944.000; CPU2: 2752.000; CPU3: 3392.000; CPU4: 3392.000; 
2015-12-15-03:20:01		CPU1: 3424.000; CPU2: 2624.000; CPU3: 2848.000; CPU4: 3392.000; 
2015-12-15-03:30:01		CPU1: 3360.000; CPU2: 3296.000; CPU3: 3200.000; CPU4: 3424.000; 
2015-12-15-03:40:01		CPU1: 3264.000; CPU2: 2880.000; CPU3: 3296.000; CPU4: 3136.000; 
2015-12-15-03:50:01		CPU1: 3328.000; CPU2: 2848.000; CPU3: 2144.000; CPU4: 2208.000; 
2015-12-15-04:00:01		CPU1: 3392.000; CPU2: 3392.000; CPU3: 3392.000; CPU4: 3392.000; 
2015-12-15-04:10:01		CPU1: 3104.000; CPU2: 3232.000; CPU3: 3392.000; CPU4: 2944.000; 
2015-12-15-04:20:01		CPU1: 3168.000; CPU2: 3168.000; CPU3: 2944.000; CPU4: 3200.000; 
2015-12-15-04:30:01		CPU1: 3392.000; CPU2: 3008.000; CPU3: 3296.000; CPU4: 3296.000; 
2015-12-15-04:40:01		CPU1: 2912.000; CPU2: 2464.000; CPU3: 3168.000; CPU4: 3200.000; 
2015-12-15-04:50:01		CPU1: 2848.000; CPU2: 3424.000; CPU3: 2848.000; CPU4: 3360.000; 
2015-12-15-05:00:01		CPU1: 3424.000; CPU2: 2400.000; CPU3: 3104.000; CPU4: 3264.000; 
2015-12-15-05:10:01		CPU1: 2784.000; CPU2: 3520.000; CPU3: 3360.000; CPU4: 2784.000; 
2015-12-15-05:20:01		CPU1: 3584.000; CPU2: 3008.000; CPU3: 3488.000; CPU4: 2880.000; 
2015-12-15-05:30:01		CPU1: 2272.000; CPU2: 2272.000; CPU3: 2272.000; CPU4: 2272.000; 
2015-12-15-05:40:01		CPU1: 2048.000; CPU2: 2176.000; CPU3: 2080.000; CPU4: 1984.000; 
2015-12-15-05:50:01		CPU1: 2976.000; CPU2: 3072.000; CPU3: 3232.000; CPU4: 3296.000; 
2015-12-15-06:00:01		CPU1: 3104.000; CPU2: 3040.000; CPU3: 3200.000; CPU4: 3232.000; 
2015-12-15-06:10:01		CPU1: 2976.000; CPU2: 2592.000; CPU3: 3360.000; CPU4: 3264.000; 
2015-12-15-06:20:01		CPU1: 2240.000; CPU2: 2240.000; CPU3: 2272.000; CPU4: 2240.000; 
2015-12-15-06:30:01		CPU1: 3392.000; CPU2: 3328.000; CPU3: 3008.000; CPU4: 3168.000;