J'essaie de compiler un programme qui utilise les instructions AVX2 des processeurs plutôt nouveaux d'Intel Haswell.
J'ai vérifié que le Macbook Pro que j'utilise dispose d'un processeur Crystalwell, qui devrait avoir les extensions AVX2 suivantes:
sysctl -n machdep.cpu.brand_string
Intel(R) Core(TM) i7-4870HQ CPU @ 2.50GHz
Mon intention est de compiler ce programme en utilisant une image VirtualBox version Ubuntu 15.10 64 bits, qui possède une version récente de gcc:
gcc (Ubuntu 5.2.1-22ubuntu2) 5.2.1 20151010
Lorsque je vérifie les extensions de la machine VirtualBox, avx2 ne figure pas dans la liste:
processor : 3
vendor_id : GenuineIntel
cpu family : 6
model : 70
model name : Intel(R) Core(TM) i7-4870HQ CPU @ 2.50GHz
stepping : 1
cpu MHz : 2494.226
cache size : 6144 KB
physical id : 0
siblings : 4
core id : 3
cpu cores : 4
apicid : 3
initial apicid : 3
fpu : yes
fpu_exception : yes
cpuid level : 13
wp : yes
flags : fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush mmx fxsr sse sse2 ht syscall nx rdtscp lm constant_tsc rep_good nopl xtopology nonstop_tsc pni pclmulqdq ssse3 cx16 sse4_1 sse4_2 movbe popcnt aes xsave avx rdrand hypervisor lahf_lm abm
bugs :
bogomips : 4988.45
clflush size : 64
cache_alignment : 64
address sizes : 39 bits physical, 48 bits virtual
power management:
Des idées?
Je me posais la même question. J'ai lu la majeure partie de la documentation de VirtualBox il y a quelque temps et je me souviens que SSE4.1/SSE4.2 est bien documenté , mais AVX2 ne l'est pas, bien qu'il soit censé être exposé à un invité depuis - VirtualBox 5.0 Beta .
Voici les drapeaux de/proc/cpuinfo sur un hôte 14.04:
flags: fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat
pse36 clflush dts acpi mmx fxsr sse sse2 ss ht tm pbe syscall nx
pdpe1gb rdtscp lm constant_tsc Arch_perfmon pebs bts rep_good nopl
xtopology nonstop_tsc aperfmperf eagerfpu pni pclmulqdq dtes64
monitor ds_cpl vmx est tm2 ssse3 fma cx16 xtpr pdcm pcid sse4_1
sse4_2 x2apic movbe popcnt tsc_deadline_timer aes xsave avx f16c
rdrand lahf_lm abm ida arat pln pts dtherm tpr_shadow vnmi
flexpriority ept vpid fsgsbase tsc_adjust bmi1 avx2 smep bmi2 erms
invpcid xsaveopt
et ici sur un VM hébergé par VirtualBox 5.0.14
flags: fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat
pse36 clflush mmx fxsr sse sse2 ht syscall nx rdtscp lm
constant_tsc rep_good nopl xtopology nonstop_tsc pni pclmulqdq
ssse3 cx16 sse4_1 sse4_2 movbe popcnt aes xsave avx rdrand
hypervisor lahf_lm abm
J'ai cherché sur Internet et téléchargé la source, ce qui m'a amené à ce billet où frank (Frank Mehnert, je suppose) explique comment désactiver AVX et - ce ticket indiqué dans le journal des modifications comme une raison pour désactiver temporairement AVX2 à partir de la version 5.0.2. Il y avait donc une raison de le désactiver et vous devriez faire attention.
J'ai exécuté VBoxManage setextradata "$vm_name" VBoxInternal/CPUM/IsaExts/AVX2 1
, démarré mon VM et AVX2 a été activé :
flags: fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat
pse36 clflush mmx fxsr sse sse2 ht syscall nx rdtscp lm
constant_tsc rep_good nopl xtopology nonstop_tsc pni pclmulqdq
ssse3 cx16 sse4_1 sse4_2 movbe popcnt aes xsave avx rdrand
hypervisor lahf_lm abm avx2
Pour vérifier j'ai exécuté x265 dans la VM:
x265 [info]: using cpu capabilities: MMX2 SSE2Fast SSSE3 SSE4.2 AVX AVX2 LZCNT
Je cherchais si quelque chose d'autre pouvait être activé, grep -r -i "search_term" .
dans le source donnait des résultats pour les termes de recherche pIsaExts
, pExtFeatureLeaf
, pFeatures
, pCurLeaf
et pCpumCfg
mais l'ajout de clés n'a aucun effet ou le VM refuse de démarrer. En parlant de cela, pour voir toutes les clés supplémentaires que vous avez définies, exécutez:
VBoxManage getextradata "$vm_name" enumerate
et pour supprimer une clé, exécutez simplement la même commande que vous avez définie pour la clé, mais sans valeur, exemple:
VBoxManage setextradata "$vm_name" VBoxInternal/CPUM/IsaExts/AVX2
Au lieu de simplement parcourir le code source, il serait préférable de lire et de comprendre les projets organisation du code source .