top of page
Anforderungen
Fokus: „Hot-Loop“-Optimierung.
Hauptverantwortlichkeiten:
Kerneloptimierung: Identifizierung und Extraktion leistungskritischer „Hot Loops“ aus KI-Kerneln.
Low-Level Dev: Schreiben Sie hocheffizienten C/C++- Code, der auf Architekturen zugeschnitten ist.
Profiling: Verwenden Sie Hardware-Debugger und Profiler, um Latenzen in KI-Inferenzpfaden zu eliminieren.
Anforderungen:
Fachkenntnisse in C/C++ und Assembler.
Hintergrund in Rechnerarchitektur oder Compilerbau.
Erfahrung mit Leistungsoptimierung und Speichermanagement.
bottom of page
