Avez-vous besoin d'une machine qui doit faire des centaines de billions de calculs à virgule flottante par seconde ? Avez-vous besoin d'une histoire pour expliquer comment votre superordinateur dans la cave a fait sauter le disjoncteur ? La construction d'un clusteur (ou grappe) d'ordinateurs à performance élevée est un défi que n'importe quel expert peut surmonter en un weekend avec le budget approprié. D'un point de vue technique, un superordinateur moderne à plusieurs processeurs est un réseau d'ordinateurs qui travaillent en parallèle pour résoudre un problème. En suivant des étapes simples pour monter l'équipement et installer les logiciels nécessaires, vous pourrez vous aussi avoir un superordinateur.
Étapes
-
Déterminez le matériel et les ressources nécessaires. Vous aurez besoin d'un nœud de tête, d'au moins douze autres nœuds identiques, d'un interrupteur Ethernet, d'une unité d'alimentation en courant et d'une étagère. Déterminez vos besoins en électricité, en refroidissement et en espace. Vous devez aussi décider de l'adresse IP que vous voulez utiliser pour vos réseaux privés, du nom des nœuds, des logiciels que vous voulez installer et de la technologie que vous voulez pour les capacités de calcul (on reviendra sur ce point plus tard).
- Même si le matériel va vous couter cher, tous les logiciels présentés dans cet article sont gratuits et la plupart sont libres de droits.
- Si vous voulez avoir une idée de la vitesse qu'un superordinateur peut atteindre, vous pouvez utiliser cet outil : https://hpl-calculator.sourceforge.net/ .
-
Installez les nœuds. Vous allez devoir assembler les nœuds ou vous procurer des serveurs préassemblés.
- Choisissez un châssis pour serveurs avec beaucoup d'espace, un système de refroidissement adapté et une optimisation de l'énergie.
- Vous pouvez aussi utiliser une douzaine de vieux serveurs, la somme de ces derniers dépassera la puissance des unités individuelles et vous économiserez beaucoup d'argent. Tous les processeurs, les adaptateurs réseau et les cartes mères doivent être identiques pour que le système en entier fonctionne sans problème. Bien sûr, vous ne devez pas oublier la RAM et le rangement pour chacun des nœuds, ainsi qu'au moins un lecteur de disque pour la tête.
-
Installez les serveurs sur l'étagère. Commencez par le bas si le haut de l'étagère n'est pas lesté. Vous aurez aussi besoin d'un ami pour vous aider, les serveurs peuvent être lourds et il va être difficile de les guider sur les rails de l'étagère.
-
Installez l'interrupteur Ethernet au-dessus du châssis. Prenez un moment pour le configurer. Autorisez une taille de cadre jumbo de 9 000 octets, réglez les adresses IP sur les adresses statiques que vous avez choisies lors de la première étape et désactivez les protocoles inutiles comme le snooping SMTP.
-
Installez l'unité de courant. Selon la puissance de courant dont les nœuds vont avoir besoin, vous allez probablement avoir besoin d'une unité de 220 volts.
-
Configurez le matériel. Une fois que vous avez tout installé, vous pouvez commencer la configuration du matériel. Linux est le système d'exploitation par défaut des clusteurs HPC, non seulement parce que c'est le meilleur environnement pour faire des calculs scientifiques, mais aussi parce qu'il est complètement gratuit à installer sur des centaines ou des milliers de nœuds. Imaginez le prix que vous allez débourser si vous deviez installer Windows sur chacun de ces nœuds.
- Commencez par installer la dernière version du BIOS et du micrologiciel de la carte mère qui devraient être les mêmes pour toutes les cartes mères.
- Installez votre distribution préférée de Linux sur chacun des nœuds et une distribution avec une interface graphique sur le nœud de tête. On utilise souvent CentOS, OpenSuse, Scientific Linux, RedHat ou SLES.
- Pour cet article, on recommande vivement Rocks Cluster . En plus d'installer tous les outils nécessaires au bon fonctionnement du clusteur, Rocks utilise une excellente méthode pour « distribuer » rapidement de nombreuses instances de lui-même aux nœuds en utilisant le boot PXE et la procédure Kickstart de Red Hat .
-
Installez les logiciels. Installez une interface de transmission de messages, de gestion des ressources et d'autres librairies nécessaires. Si vous n'avez pas installé Rocks lors de l'étape précédente, vous allez devoir configurer manuellement tous les logiciels nécessaires pour activer les mécanismes de calculs parallèles.
- Tout d'abord, vous allez avoir besoin d'un système de gestion du bash, par exemple Torque Resource Manager , qui vous permet de diviser et de répartir des tâches différentes sur plusieurs machines.
- Couplez Torque avec Maui Cluster Scheduler pour terminer la configuration.
- Ensuite, vous allez devoir installer l'interface de transmission des messages qui est nécessaire pour que les processus sur différentes machines partagent les mêmes données. Installez OpenMP , il est très facile d'utilisation.
- N'oubliez pas les librairies de multithreading et les compilateurs pour créer des programmes de calculs en parallèle. Une fois de plus, Rocks est la meilleure des solutions.
-
Reliez les nœuds en réseau. Le nœud de tête envoie les tâches à exécuter aux autres nœuds de calcul qui vont renvoyer les résultats tout en s'envoyant des messages les uns aux autres. Plus cela va vite et mieux c'est.
- Utilisez un réseau Ethernet privé pour relier tous ces nœuds en clusteur.
- Le nœud de tête peut aussi faire office de serveur NFS, PXE, DHCP, TFTP et NTP sur le réseau que vous créez.
- Vous devez séparer ce réseau des réseaux publics pour vous assurer que les paquets que les serveurs échangent n'interfèrent pas avec des paquets échangés sur le reste du réseau.
-
Testez le clusteur. La dernière chose que vous devez faire avant de libérer toute la puissance de votre superordinateur est de tester ses performances. Le test de performance HPL (High Performance Lynpack) est un choix populaire pour mesurer la vitesse de calcul d'un clusteur d'ordinateurs. Vous allez devoir le compiler depuis sa source avec toutes les optimisations que votre compilateur propose selon l'architecture que vous avez choisie.
- Évidemment, vous devez le compiler depuis la source qui vous donne le plus d'options d'optimisation possible pour votre plateforme. Par exemple, si vous utilisez des processeurs AMD, compilez-le avec Open64 en choisissant un niveau d'optimisation -0fast.
- Comparez les résultats sur TOP500.org pour savoir si votre superordinateur peut se mesurer aux 500 superordinateurs les plus puissants du monde !
Publicité
Conseils
- Pour atteindre des vitesses vraiment rapides sur le réseau, renseignez-vous à propos des interfaces InfiniBand. Cependant, préparez-vous à casser la tirelire.
- IPMI peut rendre plus facile l'administration d'un gros clusteur en vous apportant le KVM-over-IP, un cycle de courant séparé et plus encore.
- Utilisez Ganglia pour suivre les charges de calcul sur les nœuds.
Avertissements
- Assurez-vous que votre infrastructure peut supporter la charge.