Mein udoo-bolt-System braucht oft mehrere Anläufe um in den Grafikmodus zu kommen

Es ist fast sicher ein HW-Problem. Das Board ist selten und war nicht billig. Die Infos vom Handler sind verfügbar. Die Website des Herstellers ist offline, deshalb suche ich nach einer möglichst eleganten Lösung das Problem zu umgehen. Das aktuelle System ist fuss12.

Folgende Fehlerfälle können nach dem Einschalten auftreten:

  1. Der Bildschirm bleibt schwarz
  2. Es meldet sich das Bios und dann grub, dann schwarzer Bildschirm
  3. Es meldet sich das Bios und dann grub, dann Startmeldungen in großer Bios-Schrift, dann schwarzer Bildschirm.
  4. Es meldet sich das Bios und dann grub, dann Startmeldungen in großer Bios-Schrift, dann Startmeldungen in normaler Schrift, dann schwarzer Bildschirm.

Früher trat der Fehler selten auf, es reichte einfach neu zu starten. Ich stellte fest, dass das System normal ohne Grafikmodus hochfährt. Weil man nichts sieht, nimmt man an, dass es nicht bedienbar ist. Es ist über ssh erreichbar und mit ctrl-alt-fx im Konsolenmodus bedienbar. Ich war allerdings nicht in der Lage so in den Grafikmodus zu kommen.

Aktuell muss ich das System oft bis zu 4 mal starten, was lästig ist. Meine aktuelle Abkürzung ist alt+sysrec+r e i s u b (sysrec muss nur am Anfang gedrückt werden, dann alt+ r,e,i,s,u.b hintereinander. möglicherweise ist e,i nicht mal notwendig), dann startet das System neu.

Ein Problem ist, dass man die 4 Fehlerfälle nur dann unterscheiden kann, wenn man genau aufpasst, denn sie enden alle mit dem schwarzen Schirm. Ich habe Log-Daten im shared-Ordner eingestellt, die betreffen den Fehlertyp 1 und 3, sowie den funktionierenden Fall ‘ok’. Die mit amdgpu im Namen enthalten nur Zeilen mit ‘amdgpu’ und sind ohne den Zeitstempel, um die Unterschiede einfacher zu erkennen.

fli@udoo:~$ diff 251109-boot-1-amdgpu.log 251109-boot-ok-amdgpu.log 
53c53,54
< kernel: amdgpu 0000:05:00.0: [drm] Cannot find any crtc or sizes
---
> kernel: fbcon: amdgpudrmfb (fb0) is primary device
> kernel: amdgpu 0000:05:00.0: [drm] fb0: amdgpudrmfb frame buffer device
55c56
< sensors[807]: amdgpu-pci-0500
---
> sensors[881]: amdgpu-pci-0500
fli@udoo:~$ diff 251109-boot-3-amdgpu.log 251109-boot-ok-amdgpu.log 
53,55d52
< kernel: amdgpu 0000:05:00.0: [drm] Cannot find any crtc or sizes
< kernel: snd_hda_intel 0000:05:00.1: bound 0000:05:00.0 (ops amdgpu_dm_audio_component_bind_ops [amdgpu])
< sensors[812]: amdgpu-pci-0500
57a55,56
> kernel: snd_hda_intel 0000:05:00.1: bound 0000:05:00.0 (ops amdgpu_dm_audio_component_bind_ops [amdgpu])
> sensors[881]: amdgpu-pci-0500

Entscheidend scheint kernel: amdgpu 0000:05:00.0: [drm] Cannot find any crtc or sizes zu sein, hilft mir aber nicht weiter.

Ich suche nach Ideen, wie man den Grafikmodus nachträglich starten kann und bin für jede Anregung dankbar. Beim Hochfahren 3-4 mal starten ist machbar, ich fürchte, dass sich die Situation weiter verschlechtert.

See: [SOLVED!] Can't load AMD drivers in APU+GPU setup (Page 2) / Kernel & Hardware / Arch Linux Forums

Try insert in boot these parameters: pcie_aspm=1 pcie_aspm.policy=performance amdgpu.aspm=1

1 Like

Hallo Franz,

Wie ist dein Monitor am Udoo angeschlossen. Kann es sein, dass der Monitor nicht seine EDID-Daten über sein internes EEPROM preisgibt? Das würde erklären wieso der Display Controller von der AMD GPU den CRTC-Fehler ausgibt (CRTC = Cathode Ray Tube Controller).

Ich hatte zum Beispiel einen alten VGA-Monitor dessen EEPROM durch einen Blitzeinschlag gelöscht wurde, und ich musste das EEPROM neu schreiben, um wieder ein BIld zu bekommen, ohne manuell die Parameter einszustellen.

Es gibt auch EDID tools dafür, siehe: galkinvv.github.io/displays/EDIDModToFixDualLink/README.md at master · galkinvv/galkinvv.github.io · GitHub

Gruß Julian

Danke Julian,
Der Monitor ist über DVI an HDMI beim Udoo angeschlossen.

Es ist ein Timing-Problem, das sich verschlechtert. Ich habe einen Hauptschalter, der Bildschirm, Netzteil für Udoo und Switch einschaltet. Wenn ich Udoo leicht verzögert aber immer noch vor dem Stromsparmodus des Bildschirms einschalte, kommt das System fast immer das erste Mal hoch.

Ich experimentiere noch in dieser Richtung, um auch herauszufinden, was ganz schlecht ist.

Ciao Franz.

  • Con Ctrl+Alt+F1 (o F2…F5) arrivi ad un Terminal-Login?
  • da qui, dopo login con root (o da una sessione ssh), che processi vedi attivi con ps -ef ?

A parte le indicazioni sul monitor di Julian (cambialo per queste prove), è da verificare se il sistema grafico/display manager si lascia avviare manualmente; se si, un workaround potrebbe essere di inserire un ritardo nella sua partenza al boot (da capire come farlo).

1 Like

Grazie Diego,
sì, nessun problema. Al momento non posso darti il risultato di ps -ef perché il problema non si presenta più dopo aver spento il sistema per un po’.

Posso selezionare tutti e 6 i terminali Alpha e accedere, anche come root. Ctrl+Alt+F7 mostra lo schermo nero.

Non ho idea di come riavviare la grafica con uno sforzo ragionevole, ad esempio con start x, perché cambiare il runlevel o usare systemctrl isolate è molto più complicato che effettuare il login come root e poi un reboot, o la mia scorciatoia attuale alt+sysrec+r,e,i,s,u,b.

Hallo Franz,

mit

``systemctl restart lightdm’’

falls du FUSS benutzst

1 Like

Ich liefere noch ein paar Angaben nach:

root@udoo:/home/fli# lspci
...
05:00.0 VGA compatible controller: Advanced Micro Devices, Inc. [AMD/ATI] Raven Ridge [Radeon Vega Series / Radeon Vega Mobile Series] (rev 83)
05:00.1 Audio device: Advanced Micro Devices, Inc. [AMD/ATI] Raven/Raven2/Fenghuang HDMI/DP Audio Controller
05:00.2 Encryption controller: Advanced Micro Devices, Inc. [AMD] Family 17h (Models 10h-1fh) Platform Security Processor
05:00.3 USB controller: Advanced Micro Devices, Inc. [AMD] Raven USB 3.1
05:00.4 USB controller: Advanced Micro Devices, Inc. [AMD] Raven USB 3.1
05:00.5 Multimedia controller: Advanced Micro Devices, Inc. [AMD] ACP/ACP3X/ACP6x Audio Coprocessor
05:00.6 Audio device: Advanced Micro Devices, Inc. [AMD] Family 17h/19h HD Audio Controller
05:00.7 Non-VGA unclassified device: Advanced Micro Devices, Inc. [AMD] Raven/Raven2/Renoir Non-Sensor Fusion Hub KMDF driver
...
root@udoo:/home/fli# lspci -k -vvvv -s 5:00.0
05:00.0 VGA compatible controller: Advanced Micro Devices, Inc. [AMD/ATI] Raven Ridge [Radeon Vega Series / Radeon Vega Mobile Series] (rev 83) (prog-if 00 [VGA controller])
	Subsystem: Advanced Micro Devices, Inc. [AMD/ATI] Raven Ridge [Radeon Vega Series / Radeon Vega Mobile Series]
	Control: I/O+ Mem+ BusMaster+ SpecCycle- MemWINV- VGASnoop- ParErr- Stepping- SERR- FastB2B- DisINTx+
	Status: Cap+ 66MHz- UDF- FastB2B- ParErr- DEVSEL=fast >TAbort- <TAbort- <MAbort- >SERR- <PERR- INTx-
	Latency: 0, Cache Line Size: 64 bytes
	Interrupt: pin A routed to IRQ 60
	Region 0: Memory at e0000000 (64-bit, prefetchable) [size=256M]
	Region 2: Memory at f0000000 (64-bit, prefetchable) [size=2M]
	Region 4: I/O ports at e000 [size=256]
	Region 5: Memory at fe700000 (32-bit, non-prefetchable) [size=512K]
	Capabilities: [48] Vendor Specific Information: Len=08 <?>
	Capabilities: [50] Power Management version 3
		Flags: PMEClk- DSI- D1- D2- AuxCurrent=0mA PME(D0-,D1+,D2+,D3hot+,D3cold+)
		Status: D0 NoSoftRst- PME-Enable- DSel=0 DScale=0 PME-
	Capabilities: [64] Express (v2) Legacy Endpoint, MSI 00
		DevCap:	MaxPayload 256 bytes, PhantFunc 0, Latency L0s <4us, L1 unlimited
			ExtTag+ AttnBtn- AttnInd- PwrInd- RBE+ FLReset+
		DevCtl:	CorrErr- NonFatalErr- FatalErr- UnsupReq-
			RlxdOrd+ ExtTag+ PhantFunc- AuxPwr- NoSnoop+ FLReset-
			MaxPayload 256 bytes, MaxReadReq 512 bytes
		DevSta:	CorrErr- NonFatalErr- FatalErr- UnsupReq- AuxPwr- TransPend-
		LnkCap:	Port #0, Speed 8GT/s, Width x16, ASPM L0s L1, Exit Latency L0s <64ns, L1 <1us
			ClockPM- Surprise- LLActRep- BwNot- ASPMOptComp+
		LnkCtl:	ASPM Disabled; RCB 64 bytes, Disabled- CommClk+
			ExtSynch- ClockPM- AutWidDis- BWInt- AutBWInt-
		LnkSta:	Speed 8GT/s, Width x16
			TrErr- Train- SlotClk+ DLActive- BWMgmt- ABWMgmt-
		DevCap2: Completion Timeout: Not Supported, TimeoutDis- NROPrPrP- LTR+
			 10BitTagComp- 10BitTagReq- OBFF Not Supported, ExtFmt+ EETLPPrefix+, MaxEETLPPrefixes 1
			 EmergencyPowerReduction Not Supported, EmergencyPowerReductionInit-
			 FRS-
			 AtomicOpsCap: 32bit- 64bit- 128bitCAS-
		DevCtl2: Completion Timeout: 50us to 50ms, TimeoutDis- LTR- 10BitTagReq- OBFF Disabled,
			 AtomicOpsCtl: ReqEn-
		LnkCap2: Supported Link Speeds: 2.5-8GT/s, Crosslink- Retimer- 2Retimers- DRS-
		LnkCtl2: Target Link Speed: 8GT/s, EnterCompliance- SpeedDis-
			 Transmit Margin: Normal Operating Range, EnterModifiedCompliance- ComplianceSOS-
			 Compliance Preset/De-emphasis: -6dB de-emphasis, 0dB preshoot
		LnkSta2: Current De-emphasis Level: -3.5dB, EqualizationComplete+ EqualizationPhase1+
			 EqualizationPhase2+ EqualizationPhase3+ LinkEqualizationRequest-
			 Retimer- 2Retimers- CrosslinkRes: unsupported
	Capabilities: [a0] MSI: Enable- Count=1/4 Maskable- 64bit+
		Address: 0000000000000000  Data: 0000
	Capabilities: [c0] MSI-X: Enable+ Count=3 Masked-
		Vector table: BAR=5 offset=00042000
		PBA: BAR=5 offset=00043000
	Capabilities: [100 v1] Vendor Specific Information: ID=0001 Rev=1 Len=010 <?>
	Capabilities: [200 v1] Physical Resizable BAR
		BAR 0: current size: 256MB, supported: 256MB 512MB 1GB
		BAR 2: current size: 2MB, supported: 2MB 4MB 8MB 16MB 32MB 64MB 128MB 256MB
	Capabilities: [270 v1] Secondary PCI Express
		LnkCtl3: LnkEquIntrruptEn- PerformEqu-
		LaneErrStat: 0
	Capabilities: [2a0 v1] Access Control Services
		ACSCap:	SrcValid- TransBlk- ReqRedir- CmpltRedir- UpstreamFwd- EgressCtrl- DirectTrans-
		ACSCtl:	SrcValid- TransBlk- ReqRedir- CmpltRedir- UpstreamFwd- EgressCtrl- DirectTrans-
	Capabilities: [2b0 v1] Address Translation Service (ATS)
		ATSCap:	Invalidate Queue Depth: 00
		ATSCtl:	Enable-, Smallest Translation Unit: 00
	Capabilities: [2c0 v1] Page Request Interface (PRI)
		PRICtl: Enable- Reset-
		PRISta: RF- UPRGI- Stopped+
		Page Request Capacity: 00000020, Page Request Allocation: 00000000
	Capabilities: [2d0 v1] Process Address Space ID (PASID)
		PASIDCap: Exec+ Priv+, Max PASID Width: 10
		PASIDCtl: Enable- Exec- Priv-
	Capabilities: [320 v1] Latency Tolerance Reporting
		Max snoop latency: 0ns
		Max no snoop latency: 0ns
	Kernel driver in use: amdgpu
	Kernel modules: amdgpu

Danke Paolo,
werde ich morgen gleich ausprobieren, wenn der Fehler wieder auftritt.

CRTC, lang ist es her. Lange Zeit hatte ich noch einen großen und sehr teuren Monitor eines Architekturbüros im Keller stehen mit vga und BNC-Anschlüssen.

Ich interpretiere die Meldung Cannot find any crtc or sizes so:

Da der Anschluss VGA nicht belegt ist, also auch kein CRTC vorhanden ist, ist dies die Nachricht, dass die letzte untersuchte Quelle auch nicht vorhanden ist. Wobei nicht vorhanden nur bedeutet, dass innerhalb einer vordefinierten Zeitspanne sich kein Bildschirm gemeldet hat.
Während schlafende Monitore meist aufwachen, wenn sie an eine Quelle anschlossen werden, scheint der der amdgpu-Driver nicht mehrfach nach vorhandenen Monitoren zu suchen.

Ich werde die Monitordoku des Dell U2412M studieren, ob ich das Schlafengehen verzögern kann.

Hallo Franz,

Bei meinen Deskmini A300 mit Ryzen 3400G APU habe ich am VGA-Anschluss auch nichts angeschlossen, sondern nur beim HDMI (einen DELL 2415), und bekomme von dem DRM-Subsystem keine Meldung wegen fehlenden Auflösungen.

Bei mir startet das DRM direkt mit aktivierten Kernel-Modesetting d.h. die Monitor-Auflösung übernimmt der Kernel schon vom UEFI-BIOS.

# dmesg | grep -e amdgpu -e drm
[    0.431795] ACPI: bus type drm_connector registered
[    0.450729] simple-framebuffer simple-framebuffer.0: [drm] Registered 1 planes with drm panic
[    0.450732] [drm] Initialized simpledrm 1.0.0 for simple-framebuffer.0 on minor 0
[    0.454392] simple-framebuffer simple-framebuffer.0: [drm] fb0: simpledrmdrmfb frame buffer device
[    4.235524] [drm] amdgpu kernel modesetting enabled.
[    4.248554] amdgpu: Virtual CRAT table created for CPU
[    4.248573] amdgpu: Topology: Add CPU node
[    4.248698] amdgpu 0000:04:00.0: enabling device (0006 -> 0007)
[    4.248745] [drm] initializing kernel modesetting (RAVEN 0x1002:0x15D8 0x1002:0x15D8 0xC8).
[    4.248756] [drm] register mmio base: 0xFCB00000
[    4.248758] [drm] register mmio size: 524288
[    4.250491] amdgpu 0000:04:00.0: amdgpu: detected ip block number 0 <soc15_common>
[    4.250498] amdgpu 0000:04:00.0: amdgpu: detected ip block number 1 <gmc_v9_0>
[    4.250500] amdgpu 0000:04:00.0: amdgpu: detected ip block number 2 <vega10_ih>
[    4.250503] amdgpu 0000:04:00.0: amdgpu: detected ip block number 3 <psp>
[    4.250506] amdgpu 0000:04:00.0: amdgpu: detected ip block number 4 <powerplay>
[    4.250508] amdgpu 0000:04:00.0: amdgpu: detected ip block number 5 <dm>
[    4.250511] amdgpu 0000:04:00.0: amdgpu: detected ip block number 6 <gfx_v9_0>
[    4.250513] amdgpu 0000:04:00.0: amdgpu: detected ip block number 7 <sdma_v4_0>
[    4.250516] amdgpu 0000:04:00.0: amdgpu: detected ip block number 8 <vcn_v1_0>
[    4.251568] amdgpu 0000:04:00.0: amdgpu: Fetched VBIOS from VFCT
[    4.251575] amdgpu: ATOM BIOS: 113-PICASSO-114
[    4.315068] amdgpu 0000:04:00.0: vgaarb: deactivate vga console
[    4.315075] amdgpu 0000:04:00.0: amdgpu: Trusted Memory Zone (TMZ) feature enabled
[    4.315120] [drm] vm size is 262144 GB, 4 levels, block size is 9-bit, fragment size is 9-bit
[    4.315130] amdgpu 0000:04:00.0: amdgpu: VRAM: 2048M 0x000000F400000000 - 0x000000F47FFFFFFF (2048M used)
[    4.315135] amdgpu 0000:04:00.0: amdgpu: GART: 1024M 0x0000000000000000 - 0x000000003FFFFFFF
[    4.315147] [drm] Detected VRAM RAM=2048M, BAR=2048M
[    4.315149] [drm] RAM width 128bits DDR4
[    4.315384] [drm] amdgpu: 2048M of VRAM memory ready
[    4.315389] [drm] amdgpu: 6950M of GTT memory ready.
[    4.315414] [drm] GART: num cpu pages 262144, num gpu pages 262144
[    4.315661] [drm] PCIE GART of 1024M enabled.
[    4.315663] [drm] PTB located at 0x000000F47FC00000
[    4.316301] amdgpu: hwmgr_sw_init smu backed is smu10_smu
[    4.319849] amdgpu 0000:04:00.0: amdgpu: Found VCN firmware Version ENC: 1.15 DEC: 3 VEP: 0 Revision: 0
[    4.340864] amdgpu 0000:04:00.0: amdgpu: reserve 0x400000 from 0xf47f800000 for PSP TMR
[    4.407322] amdgpu 0000:04:00.0: amdgpu: RAS: optional ras ta ucode is not available
[    4.412427] amdgpu 0000:04:00.0: amdgpu: RAP: optional rap ta ucode is not available
[    4.415739] amdgpu 0000:04:00.0: amdgpu: psp gfx command LOAD_TA(0x1) failed and response status is (0x7)
[    4.415851] amdgpu 0000:04:00.0: amdgpu: psp gfx command INVOKE_CMD(0x3) failed and response status is (0x117)
[    4.415855] amdgpu 0000:04:00.0: amdgpu: Secure display: Generic Failure.
[    4.415858] amdgpu 0000:04:00.0: amdgpu: SECUREDISPLAY: query securedisplay TA failed. ret 0x0
[    4.416701] [drm] DM_PPLIB: values for F clock
[    4.416705] [drm] DM_PPLIB:   400000 in kHz, 3099 in mV
[    4.416708] [drm] DM_PPLIB:   933000 in kHz, 3574 in mV
[    4.416710] [drm] DM_PPLIB:   1200000 in kHz, 4399 in mV
[    4.416712] [drm] DM_PPLIB:   1333000 in kHz, 4399 in mV
[    4.416715] [drm] DM_PPLIB: values for DCF clock
[    4.416717] [drm] DM_PPLIB:   300000 in kHz, 3099 in mV
[    4.416719] [drm] DM_PPLIB:   600000 in kHz, 3574 in mV
[    4.416721] [drm] DM_PPLIB:   626000 in kHz, 4250 in mV
[    4.416723] [drm] DM_PPLIB:   654000 in kHz, 4399 in mV
[    4.417829] amdgpu 0000:04:00.0: amdgpu: [drm] Display Core v3.2.334 initialized on DCN 1.0
[    4.495087] [drm] kiq ring mec 2 pipe 1 q 0
[    4.511433] kfd kfd: amdgpu: Allocated 3969056 bytes on gart
[    4.511453] kfd kfd: amdgpu: Total number of KFD nodes to be created: 1
[    4.511663] amdgpu: Virtual CRAT table created for GPU
[    4.511778] amdgpu: Topology: Add dGPU node [0x15d8:0x1002]
[    4.511782] kfd kfd: amdgpu: added device 1002:15d8
[    4.511799] amdgpu 0000:04:00.0: amdgpu: SE 1, SH per SE 1, CU per SH 11, active_cu_number 11
[    4.511805] amdgpu 0000:04:00.0: amdgpu: ring gfx uses VM inv eng 0 on hub 0
[    4.511809] amdgpu 0000:04:00.0: amdgpu: ring comp_1.0.0 uses VM inv eng 1 on hub 0
[    4.511812] amdgpu 0000:04:00.0: amdgpu: ring comp_1.1.0 uses VM inv eng 4 on hub 0
[    4.511815] amdgpu 0000:04:00.0: amdgpu: ring comp_1.2.0 uses VM inv eng 5 on hub 0
[    4.511818] amdgpu 0000:04:00.0: amdgpu: ring comp_1.3.0 uses VM inv eng 6 on hub 0
[    4.511821] amdgpu 0000:04:00.0: amdgpu: ring comp_1.0.1 uses VM inv eng 7 on hub 0
[    4.511823] amdgpu 0000:04:00.0: amdgpu: ring comp_1.1.1 uses VM inv eng 8 on hub 0
[    4.511826] amdgpu 0000:04:00.0: amdgpu: ring comp_1.2.1 uses VM inv eng 9 on hub 0
[    4.511829] amdgpu 0000:04:00.0: amdgpu: ring comp_1.3.1 uses VM inv eng 10 on hub 0
[    4.511832] amdgpu 0000:04:00.0: amdgpu: ring kiq_0.2.1.0 uses VM inv eng 11 on hub 0
[    4.511835] amdgpu 0000:04:00.0: amdgpu: ring sdma0 uses VM inv eng 0 on hub 8
[    4.511838] amdgpu 0000:04:00.0: amdgpu: ring vcn_dec uses VM inv eng 1 on hub 8
[    4.511841] amdgpu 0000:04:00.0: amdgpu: ring vcn_enc0 uses VM inv eng 4 on hub 8
[    4.511843] amdgpu 0000:04:00.0: amdgpu: ring vcn_enc1 uses VM inv eng 5 on hub 8
[    4.511846] amdgpu 0000:04:00.0: amdgpu: ring jpeg_dec uses VM inv eng 6 on hub 8
[    4.518133] amdgpu: pp_dpm_get_sclk_od was not implemented.
[    4.518136] amdgpu: pp_dpm_get_mclk_od was not implemented.
[    4.518307] amdgpu 0000:04:00.0: amdgpu: Runtime PM not available
[    4.518887] amdgpu 0000:04:00.0: [drm] Registered 4 planes with drm panic
[    4.518890] [drm] Initialized amdgpu 3.64.0 for 0000:04:00.0 on minor 1
[    4.524872] amdgpu 0000:04:00.0: amdgpu: [drm] Failed to setup vendor infoframe on connector HDMI-A-1: -22
[    4.528501] fbcon: amdgpudrmfb (fb0) is primary device
[    4.528510] amdgpu 0000:04:00.0: [drm] fb0: amdgpudrmfb frame buffer device
[    5.230121] systemd[1]: Starting Load Kernel Module drm...
[    5.250078] systemd[1]: modprobe@drm.service: Deactivated successfully.
[    5.250358] systemd[1]: Finished Load Kernel Module drm.
[    6.089715] snd_hda_intel 0000:04:00.1: bound 0000:04:00.0 (ops amdgpu_dm_audio_component_bind_ops [amdgpu])

An sich selber benutzen DVI und HDMI Ports noch viele Analogien aus der VGA-Zeit, z.B. gibt es dort noch immer den I2C-Bus zur Kommunikation der Monitor-Parameter (genannt DDC-Bus) wo eben die EDID-Daten von einem im Monitor verbauten EEPROM über Grafiktreiber zur Autokonfiguration abgefragt werden.

D.h. es konnte bei dir wirklich sein, dass der Monitor nicht die EDID -Daten ausspuckt, und der AMDGPU-Treiber eben mal die Auflösung zufällig auswählt.

Hast du bei laufenden System schon probiert das von mir oben verlinkte EDID-Tool zu benutzen?

Du musst dir die Abhängigkeiten python3-smbus edid-decode i2c-tools installieren und das Tool vom Github holen und per sudo ./edid-rw den richtigen I2C-Bus des DVI-Ports abfragen.

Die EDID-Daten in Hex-Form können auch von einen Online-Dekoder verifiziert werden. Z.B. https://www.edidreader.com/

Bei meinen Monitor kommt z.B.:

# ./edid-rw
Listing available I2C buses via `i2cdetect -l`:
i2c-0   i2c             AMDGPU DM i2c hw bus 0                  I2C adapter
i2c-1   i2c             AMDGPU DM i2c hw bus 1                  I2C adapter
i2c-2   i2c             AMDGPU DM i2c hw bus 2                  I2C adapter
i2c-3   i2c             AMDGPU DM i2c hw bus 3                  I2C adapter
i2c-4   i2c             AMDGPU DM aux hw bus 0                  I2C adapter
i2c-5   i2c             AMDGPU DM aux hw bus 2                  I2C adapter
i2c-6   i2c             AMDGPU DM aux hw bus 3                  I2C adapter
i2c-7   smbus           SMBus PIIX4 adapter port 0 at 0b00      SMBus adapter
i2c-8   smbus           SMBus PIIX4 adapter port 2 at 0b00      SMBus adapter
i2c-9   smbus           SMBus PIIX4 adapter port 1 at 0b20      SMBus adapter
i2c-10  i2c             SMI-I2C0                                I2C adapter
i2c-11  i2c             SMI-I2C1                                I2C adapter
i2c-12  i2c             i2c-10-mux (chan_id 0)                  I2C adapter
i2c-13  i2c             i2c-11-mux (chan_id 0)                  I2C adapter
You have to carefully select correct bus
and pass the number X from the i2c-X bus name as command line "i2c_bus_index" argument

usage: edid-rw [-h] [-w] [-t] [-f] [-s SLEEP] i2c_bus_index
edid-rw: error: the following arguments are required: i2c_bus_index

und der HDMI-Port bei mir ist auf I2C-Bus 1:

# ./edid-rw 1 | edid-decode
edid-decode (hex):

00 ff ff ff ff ff ff 00 10 ac ba a0 4c 38 32 31
04 1d 01 03 80 34 20 78 ea 04 95 a9 55 4d 9d 26
10 50 54 a5 4b 00 71 4f 81 80 a9 40 d1 c0 d1 00
01 01 01 01 01 01 28 3c 80 a0 70 b0 23 40 30 20
36 00 06 44 21 00 00 1e 00 00 00 ff 00 37 4d 54
30 31 39 31 50 31 32 38 4c 0a 00 00 00 fc 00 44
45 4c 4c 20 55 32 34 31 35 0a 20 20 00 00 00 fd
00 31 3d 1e 53 11 00 0a 20 20 20 20 20 20 01 f8

02 03 22 f1 4f 90 05 04 03 02 07 16 01 14 1f 12
13 20 21 22 23 09 07 07 65 03 0c 00 11 00 83 01
00 00 02 3a 80 18 71 38 2d 40 58 2c 45 00 06 44
21 00 00 1e 01 1d 80 18 71 1c 16 20 58 2c 25 00
06 44 21 00 00 9e 01 1d 00 72 51 d0 1e 20 6e 28
55 00 06 44 21 00 00 1e 8c 0a d0 8a 20 e0 2d 10
10 3e 96 00 06 44 21 00 00 18 00 00 00 00 00 00
00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 81

----------------

Block 0, Base EDID:
  EDID Structure Version & Revision: 1.3
  Vendor & Product Identification:
    Manufacturer: DEL
    Model: 41146
    Serial Number: 825374796 (0x3132384c)
    Made in: week 4 of 2019
  Basic Display Parameters & Features:
    Digital display
    Maximum image size: 52 cm x 32 cm
    Gamma: 2.20
    DPMS levels: Standby Suspend Off
    RGB color display
    First detailed timing is the preferred timing
  Color Characteristics:
    Red  : 0.6601, 0.3320
    Green: 0.3017, 0.6132
    Blue : 0.1503, 0.0634
    White: 0.3134, 0.3291
  Established Timings I & II:
    IBM     :   720x400    70.081663 Hz   9:5     31.467 kHz     28.320000 MHz
    DMT 0x04:   640x480    59.940476 Hz   4:3     31.469 kHz     25.175000 MHz
    DMT 0x06:   640x480    75.000000 Hz   4:3     37.500 kHz     31.500000 MHz
    DMT 0x09:   800x600    60.316541 Hz   4:3     37.879 kHz     40.000000 MHz
    DMT 0x0b:   800x600    75.000000 Hz   4:3     46.875 kHz     49.500000 MHz
    DMT 0x10:  1024x768    60.003840 Hz   4:3     48.363 kHz     65.000000 MHz
    DMT 0x12:  1024x768    75.028582 Hz   4:3     60.023 kHz     78.750000 MHz
    DMT 0x24:  1280x1024   75.024675 Hz   5:4     79.976 kHz    135.000000 MHz
  Standard Timings:
    DMT 0x15:  1152x864    75.000000 Hz   4:3     67.500 kHz    108.000000 MHz
    DMT 0x23:  1280x1024   60.019740 Hz   5:4     63.981 kHz    108.000000 MHz
    DMT 0x33:  1600x1200   60.000000 Hz   4:3     75.000 kHz    162.000000 MHz
    DMT 0x52:  1920x1080   60.000000 Hz  16:9     67.500 kHz    148.500000 MHz
    DMT 0x45:  1920x1200   59.884600 Hz  16:10    74.556 kHz    193.250000 MHz
  Detailed Timing Descriptors:
    DTD 1:  1920x1200   59.950171 Hz  16:10    74.038 kHz    154.000000 MHz (518 mm x 324 mm)
                 Hfront   48 Hsync  32 Hback   80 Hpol P
                 Vfront    3 Vsync   6 Vback   26 Vpol P
    Display Product Serial Number: '7MT0191P128L'
    Display Product Name: 'DELL U2415'
    Display Range Limits:
      Monitor ranges (GTF): 49-61 Hz V, 30-83 kHz H, max dotclock 170 MHz
  Extension blocks: 1
Checksum: 0xf8

----------------

Block 1, CTA-861 Extension Block:
  Revision: 3
  Underscans IT Video Formats by default
  Basic audio support
  Supports YCbCr 4:4:4
  Supports YCbCr 4:2:2
  Native detailed modes: 1
  Video Data Block:
    VIC  16:  1920x1080   60.000000 Hz  16:9     67.500 kHz    148.500000 MHz (native)
    VIC   5:  1920x1080i  60.000000 Hz  16:9     33.750 kHz     74.250000 MHz
    VIC   4:  1280x720    60.000000 Hz  16:9     45.000 kHz     74.250000 MHz
    VIC   3:   720x480    59.940060 Hz  16:9     31.469 kHz     27.000000 MHz
    VIC   2:   720x480    59.940060 Hz   4:3     31.469 kHz     27.000000 MHz
    VIC   7:  1440x480i   59.940060 Hz  16:9     15.734 kHz     27.000000 MHz
    VIC  22:  1440x576i   50.000000 Hz  16:9     15.625 kHz     27.000000 MHz
    VIC   1:   640x480    59.940476 Hz   4:3     31.469 kHz     25.175000 MHz
    VIC  20:  1920x1080i  50.000000 Hz  16:9     28.125 kHz     74.250000 MHz
    VIC  31:  1920x1080   50.000000 Hz  16:9     56.250 kHz    148.500000 MHz
    VIC  18:   720x576    50.000000 Hz  16:9     31.250 kHz     27.000000 MHz
    VIC  19:  1280x720    50.000000 Hz  16:9     37.500 kHz     74.250000 MHz
    VIC  32:  1920x1080   24.000000 Hz  16:9     27.000 kHz     74.250000 MHz
    VIC  33:  1920x1080   25.000000 Hz  16:9     28.125 kHz     74.250000 MHz
    VIC  34:  1920x1080   30.000000 Hz  16:9     33.750 kHz     74.250000 MHz
  Audio Data Block:
    Linear PCM:
      Max channels: 2
      Supported sample rates (kHz): 48 44.1 32
      Supported sample sizes (bits): 24 20 16
  Vendor-Specific Data Block (HDMI), OUI 00-0C-03:
    Source physical address: 1.1.0.0
  Speaker Allocation Data Block:
    FL/FR - Front Left/Right
  Detailed Timing Descriptors:
    DTD 2:  1920x1080   60.000000 Hz  16:9     67.500 kHz    148.500000 MHz (518 mm x 324 mm)
                 Hfront   88 Hsync  44 Hback  148 Hpol P
                 Vfront    4 Vsync   5 Vback   36 Vpol P
    DTD 3:  1920x1080i  60.000000 Hz  16:9     33.750 kHz     74.250000 MHz (518 mm x 324 mm)
                 Hfront   88 Hsync  44 Hback  148 Hpol P
                 Vfront    2 Vsync   5 Vback   15 Vpol P Vfront +0.5 Odd Field
                 Vfront    2 Vsync   5 Vback   15 Vpol P Vback  +0.5 Even Field
    DTD 4:  1280x720    60.000000 Hz  16:9     45.000 kHz     74.250000 MHz (518 mm x 324 mm)
                 Hfront  110 Hsync  40 Hback  220 Hpol P
                 Vfront    5 Vsync   5 Vback   20 Vpol P
    DTD 5:   720x480    59.940060 Hz   3:2     31.469 kHz     27.000000 MHz (518 mm x 324 mm)
                 Hfront   16 Hsync  62 Hback   60 Hpol N
                 Vfront    9 Vsync   6 Vback   30 Vpol N
Checksum: 0x81  Unused space in Extension Block: 21 bytes

Gruß Julian

Danke Julian,
mit deiner genauen Beschreibung werde ich das EDID-Tool installieren und ausprobieren.

Meine Überlegungen:

  • Es ist ein transienter Fehler. Keine Ahnung, welche Einflüsse eine Rolle spielen. Wenn ich morgens das System starten will, musste ich zuletzt bis zu 4 mal starten, um in den Grafikmodus zu kommen. Wenn ich weiß, dass ich das System für mindestens 1 h nicht benötige, schalte ich das System komplett ab und habe gute Chancen beim nächsten Start am Tag gleich in den Grafikmodus zu gelangen oder allenfalls nach einem weiteren Versuch.
  • Wenn das System im Grafikmodus hochfährt ist auch der Fehler Cannot find any crtc or sizes nicht vorhanden.
  • Im laufenden System müsste mir das Tool immer die EDID-Daten ausgeben. Oder verstehe ich was falsch?
  • Wenn ich deine Startmeldungen mit meinen Logs vergleiche, so sehen sie sehr ähnlich aus. In deinem Ausschnitt kommt “iommu” nicht vor, während das bei mir in Fehlermeldungen aufscheint, allerdings unabhängig, ob der Start im Grafikmodus gelingt oder nicht.
kernel: kfd kfd: amdgpu: error getting iommu info. is the iommu enabled?
kernel: kfd kfd: amdgpu: Error initializing iommuv2
kernel: kfd kfd: amdgpu: device 1002:15dd NOT added due to errors

Danke,
Franz

War nicht schwer:

root@udoo:/home/fli/edid-checked-writer-master# ./edid-rw
Listing available I2C buses via `i2cdetect -l`:
i2c-0	smbus     	SMBus PIIX4 adapter port 0 at 0b00	SMBus adapter
i2c-1	smbus     	SMBus PIIX4 adapter port 2 at 0b00	SMBus adapter
i2c-2	smbus     	SMBus PIIX4 adapter port 1 at 0b20	SMBus adapter
i2c-3	i2c       	AMDGPU DM i2c hw bus 0          	I2C adapter
i2c-4	i2c       	AMDGPU DM i2c hw bus 1          	I2C adapter
i2c-5	i2c       	AMDGPU DM i2c hw bus 2          	I2C adapter
i2c-6	i2c       	AMDGPU DM i2c hw bus 3          	I2C adapter
i2c-7	i2c       	AMDGPU DM aux hw bus 2          	I2C adapter
i2c-8	i2c       	AMDGPU DM aux hw bus 3          	I2C adapter

root@udoo:/home/fli/edid-checked-writer-master# ./edid-rw 4| edid-decode
edid-decode (hex):

00 ff ff ff ff ff ff 00 10 ac 7a a0 4c 4c 59 33
2c 16 01 03 80 34 20 78 ea ee 95 a3 54 4c 99 26
0f 50 54 a1 08 00 81 40 81 80 a9 40 b3 00 d1 c0
01 01 01 01 01 01 28 3c 80 a0 70 b0 23 40 30 20
36 00 06 44 21 00 00 1a 00 00 00 ff 00 59 31 48
35 54 32 42 32 33 59 4c 4c 0a 00 00 00 fc 00 44
45 4c 4c 20 55 32 34 31 32 4d 0a 20 00 00 00 fd
00 32 3d 1e 53 11 00 0a 20 20 20 20 20 20 00 f0

----------------

Block 0, Base EDID:
  EDID Structure Version & Revision: 1.3
  Vendor & Product Identification:
    Manufacturer: DEL
    Model: 41082
    Serial Number: 861490252
    Made in: week 44 of 2012
  Basic Display Parameters & Features:
    Digital display
    Maximum image size: 52 cm x 32 cm
    Gamma: 2.20
    DPMS levels: Standby Suspend Off
    RGB color display
    First detailed timing is the preferred timing
  Color Characteristics:
    Red  : 0.6396, 0.3300
    Green: 0.2998, 0.5996
    Blue : 0.1503, 0.0595
    White: 0.3134, 0.3291
  Established Timings I & II:
    IBM     :   720x400    70.081663 Hz   9:5     31.467 kHz     28.320000 MHz
    DMT 0x04:   640x480    59.940476 Hz   4:3     31.469 kHz     25.175000 MHz
    DMT 0x09:   800x600    60.316541 Hz   4:3     37.879 kHz     40.000000 MHz
    DMT 0x10:  1024x768    60.003840 Hz   4:3     48.363 kHz     65.000000 MHz
  Standard Timings:
    DMT 0x20:  1280x960    60.000000 Hz   4:3     60.000 kHz    108.000000 MHz
    DMT 0x23:  1280x1024   60.019740 Hz   5:4     63.981 kHz    108.000000 MHz
    DMT 0x33:  1600x1200   60.000000 Hz   4:3     75.000 kHz    162.000000 MHz
    DMT 0x3a:  1680x1050   59.954250 Hz  16:10    65.290 kHz    146.250000 MHz
    DMT 0x52:  1920x1080   60.000000 Hz  16:9     67.500 kHz    148.500000 MHz
  Detailed Timing Descriptors:
    DTD 1:  1920x1200   59.950171 Hz   8:5     74.038 kHz    154.000000 MHz (518 mm x 324 mm)
                 Hfront   48 Hsync  32 Hback   80 Hpol P
                 Vfront    3 Vsync   6 Vback   26 Vpol N
    Display Product Serial Number: 'Y1H5T2B23YLL'
    Display Product Name: 'DELL U2412M'
    Display Range Limits:
      Monitor ranges (GTF): 50-61 Hz V, 30-83 kHz H, max dotclock 170 MHz
Checksum: 0xf0

Sieht doch gut aus. Bin gespannt, was der Befehl sagt, wenn der Grafikmodus nicht aktiv ist.

Hallo Franz,

IOMMU ist nur wichtig wenn du virtuelle Maschinen mit passthrough für PCIe-Geräte machen möchtest, ansonsten brauchst du das nicht.

Auch ich bin eben gespannt darauf, ob die EDID-Daten kommen, wenn bei dir das System mit dem Grafikmodus-Fehler startet.

Gruß Julian

Hi Julian,
die Erweiterung von Murphys Law ist da. Heute morgen gleich das erst Mal im Grafikmodus hochgefahren. Ausgeschaltet, nach dem Frühstück noch mal probiert und wieder tritt der Fehler nicht auf.

@paolo.dongilli , @diego.maniacco , @ciampix
If the error occurs, I will perform the analyses and bring the results.

Um einen Vergleich zu haben, wenn die Grafik nicht da ist:

root@udoo:/home/fli# systemctl status lightdm
● lightdm.service - Light Display Manager
     Loaded: loaded (/lib/systemd/system/lightdm.service; enabled; preset: enabled)
     Active: active (running) since Wed 2025-11-12 08:45:50 CET; 20min ago
       Docs: man:lightdm(1)
   Main PID: 1116 (lightdm)
      Tasks: 12 (limit: 37129)
     Memory: 146.5M
        CPU: 34.100s
     CGroup: /system.slice/lightdm.service
             ├─1116 /usr/sbin/lightdm
             └─1133 /usr/lib/xorg/Xorg :0 -seat seat0 -auth /var/run/lightdm/root/:0 -nolisten tcp vt7 -novtswitch

Nov 12 08:45:50 udoo systemd[1]: Started lightdm.service - Light Display Manager.
Nov 12 08:45:51 udoo lightdm[1528]: rm: cannot remove '/var/lib/AccountsService/users/*': No such file or directory
Nov 12 08:45:51 udoo lightdm[1530]: Error getting user list from org.freedesktop.Accounts: GDBus.Error:org.freedesktop.DBus.Error.ServiceUnknown: The name org.freedesktop.Accounts>
Nov 12 08:45:51 udoo lightdm[1535]: rm: cannot remove '/var/lib/AccountsService/users/*': No such file or directory
Nov 12 08:45:51 udoo lightdm[1530]: pam_unix(lightdm-greeter:session): session opened for user lightdm(uid=111) by (uid=0)
Nov 12 08:46:03 udoo lightdm[1706]: gkr-pam: unable to locate daemon control file
Nov 12 08:46:03 udoo lightdm[1706]: gkr-pam: stashed password to try later in open session
Nov 12 08:46:03 udoo lightdm[1706]: Error getting user list from org.freedesktop.Accounts: GDBus.Error:org.freedesktop.DBus.Error.ServiceUnknown: The name org.freedesktop.Accounts>
Nov 12 08:46:03 udoo lightdm[1706]: pam_unix(lightdm:session): session opened for user flineu(uid=1002) by (uid=0)
Nov 12 08:46:04 udoo lightdm[1706]: gkr-pam: unlocked login keyring

Seit 11.11. ist das System jedes mal in den Grafikmodus hochgefahren. Eigentlich genau das, was ich haben wollte.

Ich weiß, was ich jetzt alles im Fehlerfall prüfen kann und bin zuversichtlich dann durch einen Neustart des lightdm in den Grafikmodus zu kommen. Und ich werde darüber berichten, auch wenn es länger dauern sollte.

Update:
Bei der Überlegung, welche Änderung für das richtige Verhalten verantwortlich sein könnte:

  • keine Einstellungen am fuss12 geändert
  • nur das Programm lt. Vorschlag von @j54n1n installiert
  • keine Änderungen an den Anschlüssen und Kabel des Monitors
  • aber das Monitormenü aufgerufen, um zu prüfen ob ich beim Timing was ändern kann. Dabei festgestellt, dass die Eingänge automatisch abgesucht werden. Dann fix auf DVI umgestellt und die Umstellung wieder rückgängig gemacht, um diese Änderung erst dann umzustellen, wenn das System nicht in den Grafikmodus startet. Da ich die Einstellungen die letzten 10 Jahre sicher nicht geändert habe, jetzt aber die Einstellungen gespeichert wurden, könnte das die Ursache sein.

Danke an Alle!