VMworld 2018 – Recapitulatif jour 4

Ludovic Rivallain Nov 8, 2018 · 3 min read ·

Share on:

Quatrième et dernier jour du VMworld, on commençait un peu à se sentir à la maison à force d'arpenter les allés du Fira Barcelona Gran Via.

Moins de conférences pour moi aujourd'hui mais pas une journée moins intéressante pour autant car celà permet de faire le tour du hall des exposants et de découvrir bien des solutions innovantes.

#VIN1249BER – vSphere Clustering Deep Dive, Part 1: vSphere HA and DRS

Auteur de la notice ci-dessous: Ludovic Rivallain
Vidéo
Speakers(s): Frank Denneman, Duncan Epping

On ne présentera pas en détail Frank et Duncan mais pour résumer, on a à faire à 2 rock stars, notamment auteurs de la série (Host et Clustering) DeepDive: des bibles pour administrateurs de systèmes de virtualisation VMware. La conférence aborde justement un morceau du dernier opus: "Clustering Deep Dive".

vSphere HA

Avec un taux d'adoption supérieur à 90%, c'est clairement la feature la plus utilisé de l'écosystème VMware. Il est vrai que relancer sur un host sein une VM après le crash de son précédent hyperviseur, est devenu naturel pour tous les administrateurs réseau.

Si les paramètres de configurations nous semblent familiers, Duncan insiste sur l'importance de les tester (et àa chaque changement), et pas en production… L'impact de certains pouvant être désastreux sur la résilience de votre infrastructure.

S'en suit une petite analyse de certains paramètres:

Restart priority (priorisation en 5 niveau des redémarrages)
Restart dependancy (une règle inviolable, à utiliser avec parcimonie)
Admission control (assurez le redémarrage de vos VMs)

Et pour finir le chapitre, DeepDive dans les logs d'un cluster ESXi dans le cas des incidents suivants:

Scénario 1: host failure: qui n'a jamais connu ça ? (dans la salle: personne)
Scénario 2: Perte du stockage: Permanent Storage Loss ou All Paths Down (APD)
Scénario 3: Isolation and partition response: de l'intérêt de choisir son adresse d'isolation entre autres.

Rapide présentation de proactive HA, qui permet d'analyser la dégradation de l'état d'un équipement matériel pour anticiper une panne (et provoquer en amont, la migration du workload). Proactive HA est à priori, peu déployé pour le moment.

vSphere DRS

Depuis 2006, cette technologie permet de load balancer la charge d'un clsuter d'ESXi, dès le démarrage des VMs ou pendant leur fonctionnement (via la migration à chaud: vMotion)

Frank explique en détail les différentes métriques utilisées pour pondérer l'état de santé d'une VM, de son voisinage et son future état si on décide de la déplacer. Toutes les métriques ne se valent pas mais depuis 12 ans, DRS s'est doté de nouvelles possibilité de configuration qui permettent, si on les utilisent bien, d'optimiser le placement des VMs dans le cluster.

L'occasion de parler de CPU %ready, de mémoire active Vs consumed, de distribution de VM, de network aware DRS etc.

Visiblement le settings VM distribution (qui essaye tout de même de priilégier le "VM Happiness") a 3 uses-case principaux:

Prouver à son boss que DRS fonctionne quand celui-ci ne comprend rien.
Le cas du stockage IP based
Réduire un peu les domaines de pannes.

Et fin sur le Predictive DRS (Associé à vROPS) qui permet de prédire le comportement sur les 60 prochaines minutes et pondère la possibilité de migrer une VM avec son current Happiness-State.