Torna indietro   Hardware Upgrade Forum > Altre Discussioni > Amministrazione e Configurazione Server

FUJIFILM X-T30 III, la nuova mirrorless compatta
FUJIFILM X-T30 III, la nuova mirrorless compatta
FUJIFILM X-T30 III è la nuvoa fotocamera mirrorless pensata per chi si avvicina alla fotografia e ricerca una soluzione leggera e compatta, da avere sempre a disposizione ma che non porti a rinunce quanto a controllo dell'immagine.
Oracle AI World 2025: l'IA cambia tutto, a partire dai dati
Oracle AI World 2025: l'IA cambia tutto, a partire dai dati
Da Las Vegas, la visione di Larry Ellison e la concretezza di Clay Magouyrk definiscono la nuova traiettoria di Oracle: portare l’intelligenza artificiale ai dati, non i dati all’intelligenza, costruendo un’infrastruttura cloud e applicativa in cui gli agenti IA diventano parte integrante dei processi aziendali, fino al cuore delle imprese europee
Micron e millisecondi: la piattaforma ServiceNow guida l'infrastruttura IT di Aston Martin F1
Micron e millisecondi: la piattaforma ServiceNow guida l'infrastruttura IT di Aston Martin F1
Dalla precisione estrema dei componenti alla gestione digitale dei processi: come la piattaforma ServiceNow consente ad Aston Martin Aramco Formula One Team di ottimizzare risorse IT e flussi operativi in un ambiente dove ogni millesimo di secondo conta
Tutti gli articoli Tutte le news

Vai al Forum
Rispondi
 
Strumenti
Old 17-02-2016, 10:06   #1
c3n2o
Member
 
L'Avatar di c3n2o
 
Iscritto dal: Jul 2015
Messaggi: 275
Server ESx: VM che si impallano con poche VM accese

Salve a tutti,
in ditta abbiamo un blade m1000e con su un server PowerEdge M820 con 16 Core e 128Gb di RAM con su ESx 5.5.0 (2068190)
Il problema e che se accendo 3 o 4 macchine anche se sia i Core che la RAM sono ampiamente sotto il 50%, si rallenta tutto.

Qualcuno mi ha detto che potrebbe dipendere dal fatto che il Blade è collegato in iSCSI allo storage e quindi abbiamo un collo di bottiglia lì, ma a me sembra strano che gli altri server del Blade non soffrano dello stesso problema (a parte che 4 VM sugli altri host è impossibile accendere).

Io ho pensato che fosse più un discorso di configurazione della lama specifica M820, che magari non è configurata bene..
Oppure potrebbe dipendere dal fatto che i dischi iSCSI sono di tipo VMFS3 e non VMFS5..??

Come faccio a controllare?
Avete suggerimenti?
Devo andare dull'iDRAC (o quello che è) dell'M820, dell' M1000e o della scheda di rete del Blade(m6220)?

Grazie
c3n2o è offline   Rispondi citando il messaggio o parte di esso
Old 17-02-2016, 15:53   #2
Kaya
Senior Member
 
Iscritto dal: Apr 2005
Messaggi: 3247
Ci vuole un po di diagnostica per capire.
Guarda quali sono i carichi di rete sugli switch e sul server e inizia a fare un po di throobleshooting.
Anche i log di sistema aiutano.
Quante VM hai su?
Prova a fare i test con accensione di macchine diverse.
Kaya è offline   Rispondi citando il messaggio o parte di esso
Old 17-02-2016, 19:42   #3
malatodihardware
Senior Member
 
L'Avatar di malatodihardware
 
Iscritto dal: Sep 2008
Messaggi: 3583
Ma le macchine cosa fanno girare? Perché se dici che sugli altri host è impossibile accenderle devono essere belle pesanti..

Inviato dal mio Nexus 5
malatodihardware è offline   Rispondi citando il messaggio o parte di esso
Old 18-02-2016, 12:28   #4
c3n2o
Member
 
L'Avatar di c3n2o
 
Iscritto dal: Jul 2015
Messaggi: 275
Ci sono 10 VM, di cui accese sempre 2 con 8core e 12Gb di RAM a testa (quindi i core già "saturano" la CPU), se ne accendo una terza in media con 4/6 core e <10Gb di RAM.. tutte le macchine hanno Win2012

Il problema è quando ne accendo una quarta qualunque sia.. allora tutte le VM rallentano.. anche se la CPU resta abbondantemente sotto il 50% di utilizzo..
c3n2o è offline   Rispondi citando il messaggio o parte di esso
Old 18-02-2016, 13:21   #5
nanotek
Senior Member
 
Iscritto dal: Sep 2007
Messaggi: 315
Sono VM a cui assegnato molte risorse, quindi belle pesanti quando girano..
Non è che alla quarta la ram viene saturata e inizia a utilizzare lo swap ?
nanotek è offline   Rispondi citando il messaggio o parte di esso
Old 18-02-2016, 13:43   #6
c3n2o
Member
 
L'Avatar di c3n2o
 
Iscritto dal: Jul 2015
Messaggi: 275
Quote:
Originariamente inviato da nanotek Guarda i messaggi
Sono VM a cui assegnato molte risorse, quindi belle pesanti quando girano..
Non è che alla quarta la ram viene saturata e inizia a utilizzare lo swap ?
In totale il server ha 128Gb.. quindi non penso..
Esagerando arriviamo a 64Gb occupati sull'host esx..

Magari sono le VM che fanno lo swap sul disco?
Ma lo fanno anche se non sono utilizzate?

Grazie
c3n2o è offline   Rispondi citando il messaggio o parte di esso
Old 18-02-2016, 13:59   #7
Kaya
Senior Member
 
Iscritto dal: Apr 2005
Messaggi: 3247
Io credo che se saturi la cpu già con 2 VM.....è plausibile che qualcosa non torni nei conti!
Kaya è offline   Rispondi citando il messaggio o parte di esso
Old 18-02-2016, 14:02   #8
c3n2o
Member
 
L'Avatar di c3n2o
 
Iscritto dal: Jul 2015
Messaggi: 275
Quote:
Originariamente inviato da Kaya Guarda i messaggi
Io credo che se saturi la cpu già con 2 VM.....è plausibile che qualcosa non torni nei conti!
Quindi se uso 8+8 core (su un totale di 16 disponibili) anche se poi l'utilizzo resta basso, cmq la cpu si satura?
c3n2o è offline   Rispondi citando il messaggio o parte di esso
Old 18-02-2016, 17:15   #9
Kaya
Senior Member
 
Iscritto dal: Apr 2005
Messaggi: 3247
Quote:
Originariamente inviato da c3n2o Guarda i messaggi
Quindi se uso 8+8 core (su un totale di 16 disponibili) anche se poi l'utilizzo resta basso, cmq la cpu si satura?
MAh... presumo di si:
https://communities.vmware.com/threa...art=0&tstart=0
http://www.zdnet.com/article/virtual...o-pcpu-ratios/

Ma se ci pensi è anche logico.
Fai un esempio.
Hai una pCPU con due core e due thread, e 4 VM con una vCPU dual thred.
Ti trovi quindi con 4 pCPU e 8vCPU.
Ogni volta che l'hypervisor deve gestire la singola VM, deve ricaricare in memoria tutti i dati relativi a quel processo faccendo un notevolo overhead di lavoro.

Io proverei a ridurre il numero di vCPU sugli host e capire cosa succede

(Faccio un disclaimer che quanto detto sopra riguarda nozioni vecchie, quindi non so se ricordo bene o hanno cambiato le cose)
Kaya è offline   Rispondi citando il messaggio o parte di esso
Old 18-02-2016, 17:41   #10
nanotek
Senior Member
 
Iscritto dal: Sep 2007
Messaggi: 315
Ops.. ho sbagliato nel leggere la ram.. chiedo venia

Ma la differenza dovrebbe sentirsi solo se il carico della cpu inizia a salire. Chiaro che se metti più core virtuali di quelli fisici disponibili le VM inizieranno a rubarsi cicli di cpu a vicenda ma dovresti anche vedere che i core fisici si saturano.
nanotek è offline   Rispondi citando il messaggio o parte di esso
Old 18-02-2016, 23:30   #11
malatodihardware
Senior Member
 
L'Avatar di malatodihardware
 
Iscritto dal: Sep 2008
Messaggi: 3583
Tutti quei core sulle VM servono realmente o li metti solo perché li hai? La best practices di vmware è mettere meno core possibili e salire solo se necessario. Per VM ad uso "standard" difficilmente serve andare oltre i 4 core e spesso anche solo 2 sono sufficienti..

Paradossalmente ci sono dei casi in cui la VM potrebbe essere più performante riducendo il numero di core invece che incrementandolo. La ram non c'entra nulla..

Inviato dal mio Nexus 5
malatodihardware è offline   Rispondi citando il messaggio o parte di esso
Old 19-02-2016, 09:12   #12
Kaya
Senior Member
 
Iscritto dal: Apr 2005
Messaggi: 3247
Quote:
Originariamente inviato da nanotek Guarda i messaggi
Ops.. ho sbagliato nel leggere la ram.. chiedo venia

Ma la differenza dovrebbe sentirsi solo se il carico della cpu inizia a salire. Chiaro che se metti più core virtuali di quelli fisici disponibili le VM inizieranno a rubarsi cicli di cpu a vicenda ma dovresti anche vedere che i core fisici si saturano.
Mai sentito parlare di Context Switch? https://en.wikipedia.org/wiki/Context_switch

Io, ripeto, valuterei di ridurre il numero di vCpu assegnte, o comunque fare dei test tenendo ben in considerazione questo fattore e cercare un riscontro.
Kaya è offline   Rispondi citando il messaggio o parte di esso
Old 19-02-2016, 14:51   #13
c3n2o
Member
 
L'Avatar di c3n2o
 
Iscritto dal: Jul 2015
Messaggi: 275
Non possiamo ridurre il numero di CPU.. se no le VM si siedono..

Pur parlè (e per capire )..
abbiamo un altro server diverso dal Blade (è un R720) con 20 core (40 logical processor).. e ci sono 6 VM accese con un totale di 34 vCPU occupate, e oltre 50 Gb di RAM occupata (su 64Gb totali), però lo storage è in fibra.. e non c'è nessun rallentamento.. pur avendo come detto 6VM accese!!

Quindi forse quello che conta di più sono i logical processor che sul blade ne ha 32 (2x socket, 8x Core, 32x logical processor)..
..ma in questo caso cmq siamo al di sotto della soglia delle 32 vCPU, ma le VM si impallano cmq..

Oggi prometto di leggere tutti i link che mi avete mandato che sembrano molto interessanti

Grazie ancora
c3n2o è offline   Rispondi citando il messaggio o parte di esso
Old 19-02-2016, 18:42   #14
malatodihardware
Senior Member
 
L'Avatar di malatodihardware
 
Iscritto dal: Sep 2008
Messaggi: 3583
Per curiosità cosa ospitano le VM?

Inviato dal mio Nexus 5
malatodihardware è offline   Rispondi citando il messaggio o parte di esso
Old 19-02-2016, 19:30   #15
Tasslehoff
Senior Member
 
L'Avatar di Tasslehoff
 
Iscritto dal: Nov 2001
Città: Kendermore
Messaggi: 6660
Forse mi sono perso qualche pezzo, però a me non è molto chiaro quali sono i sintomi.

Le vm risultano rallentate ma rispondono comunque oppure non rispondono del tutto?
Se i servizi non rispondono, le macchine sono cmq raggiungibili via rete (es ping, se icmp è permesso)?
Se con un ping si raggiungono i server, i servizi rispondono tramite telnet?

Quando parli di occupazione CPU a quali cpu ti riferisci?
Le CPU dell'host vmware o le vCPU delle vm?

Io non escluderei nulla.
Indagherei sia sugli aspetti giustamente evidenziati da Kaya, ma indagherei anche lato I/O.
Ad es, tu dici che le altre vm che risiedono su altri blade usano iSCSI come questo blade, ma questo non ci dice nulla su eventuali colli di bottiglia rappresentati da datastore troppo sollecitati.
A prescindere dal protocollo (iSCSI, FC, SAS, NFS etc etc etc...) è più facile che i problemi di I/O derivino dall'hardware troppo carico (o scarsamente performante) piuttosto che dalla scarsa banda data da controller/protocollo.
Hai verificato su quale datastore vanno a insistere le vm che girano su questo blade?
Le lun di quel datastore stanno tutte sullo stesso array oppure su array differenti?

Insisto poi sul monitoraggio anche lato guest, guardare le statistiche di vmware è utile, ma ti mostra solo una parte dell'architettura, devi controllare e monitorare anche lato guest, quindi sulle vm.
__________________
https://tasslehoff.burrfoot.it | Cloud? Enough is enough! | SPID… grazie ma no grazie
"Arguing that you don't care about the right to privacy because you have nothing to hide is no different than saying you don't care about free speech because you have nothing to say."
Tasslehoff è offline   Rispondi citando il messaggio o parte di esso
Old 19-02-2016, 20:24   #16
c3n2o
Member
 
L'Avatar di c3n2o
 
Iscritto dal: Jul 2015
Messaggi: 275
Quote:
Originariamente inviato da malatodihardware Guarda i messaggi
Per curiosità cosa ospitano le VM?
Sono server x immagini medicali, quindi necessitano di molte risorse hw..


Quote:
Originariamente inviato da Tasslehoff Guarda i messaggi
Le vm risultano rallentate ma rispondono comunque oppure non rispondono del tutto?
Se i servizi non rispondono, le macchine sono cmq raggiungibili via rete (es ping, se icmp è permesso)?
Se con un ping si raggiungono i server, i servizi rispondono tramite telnet?

Quando parli di occupazione CPU a quali cpu ti riferisci?
Le CPU dell'host vmware o le vCPU delle vm?

...

Hai verificato su quale datastore vanno a insistere le vm che girano su questo blade?
Le lun di quel datastore stanno tutte sullo stesso array oppure su array differenti?
In questi giorni le macchine sono sotto test, quindi sono accese solo le 2 VM x i test (8vCPU e 16Gb ram) e le altre accese una alla volta seconda la necessità..
Appena finiscono i test inizierò a fare tutte queste prove consigliate..

Grazie molte

Ultima modifica di c3n2o : 23-02-2016 alle 12:29.
c3n2o è offline   Rispondi citando il messaggio o parte di esso
Old 21-02-2016, 19:25   #17
alex87alex
Senior Member
 
L'Avatar di alex87alex
 
Iscritto dal: Aug 2007
Messaggi: 1245
Una prova stupida che puoi fare è assegnare meno vcore ad ogni vm e vedere se regge...
__________________
Bla Bla Bla
alex87alex è offline   Rispondi citando il messaggio o parte di esso
Old 02-03-2016, 19:45   #18
LoneRunner
Senior Member
 
L'Avatar di LoneRunner
 
Iscritto dal: Sep 2003
Città: Torino
Messaggi: 1205
Ciao,

non riesci a postarci un po' di grafici del vSphere?

Da lì si intuisce se hai colli di bottiglia sullo storage, sulla Cpu o sulla network.

Inoltre cosa state usando come storage? E' collegato in Gbit? o in 10Gbit?

I vmware tool sono installati correttamente sulle VPS in questione?


Ti chiedo questo per escludere tutta una serie di fattori, tra cui in primis uno storage lento che, inesorabilmente, manda a palla le CPU dei nodi...
__________________
--
LoneRunner è offline   Rispondi citando il messaggio o parte di esso
Old 04-03-2016, 11:01   #19
Jones D. Daemon
Senior Member
 
Iscritto dal: Jun 2011
Messaggi: 2814
Piccola domanda: quale è la velocità di collegamento dello storage, e che tipo di storage stai usando?
__________________
IntelCore i7 4770s - Asus H97I-PLUS - 2 x 8gb Kingston HyperX Fury - NZXT Manta Black/Red - Cooler Master V700 - 2 x Samsung 850 EVO 250GB Raid0 - WD Caviar RED 2TB - MSI GTX 1070 Gaming X
Jones D. Daemon è offline   Rispondi citando il messaggio o parte di esso
 Rispondi


FUJIFILM X-T30 III, la nuova mirrorless compatta FUJIFILM X-T30 III, la nuova mirrorless compatta
Oracle AI World 2025: l'IA cambia tutto, a partire dai dati Oracle AI World 2025: l'IA cambia tutto, a parti...
Micron e millisecondi: la piattaforma ServiceNow guida l'infrastruttura IT di Aston Martin F1 Micron e millisecondi: la piattaforma ServiceNow...
ASUS GeForce RTX 5080 Noctua OC Edition: una custom fenomenale, ma anche enorme ASUS GeForce RTX 5080 Noctua OC Edition: una cus...
Dreame Aqua10 Ultra Roller, la pulizia di casa con un rullo Dreame Aqua10 Ultra Roller, la pulizia di casa c...
Il nuovo M5 fa la differenza anche nel g...
Le AirPods ora sono in grado di rilevare...
Oggi su Amazon succede di tutto: sconti ...
'Copilot Gaming mi spiava!': le accuse d...
Mova P50 Pro Ultra, robot aspirapolvere ...
Speciale action cam: doppio sconto solo ...
Eureka J15 Ultra conquista Amazon: aspir...
Game Pass è sempre più ric...
20 milioni di utenti contro Apple: grand...
La sonda spaziale europea ESA JUICE &egr...
La capsula Orion Integrity è stat...
Intel Nova Lake: i driver Linux svelano ...
Nothing punta sulla fascia bassa: ecco c...
Redmi Watch 6 è ufficiale: si pre...
Arriva Snapdragon 6s Gen 4: l'obiettivo ...
Chromium
GPU-Z
OCCT
LibreOffice Portable
Opera One Portable
Opera One 106
CCleaner Portable
CCleaner Standard
Cpu-Z
Driver NVIDIA GeForce 546.65 WHQL
SmartFTP
Trillian
Google Chrome Portable
Google Chrome 120
VirtualBox
Tutti gli articoli Tutte le news Tutti i download

Strumenti

Regole
Non Puoi aprire nuove discussioni
Non Puoi rispondere ai messaggi
Non Puoi allegare file
Non Puoi modificare i tuoi messaggi

Il codice vB è On
Le Faccine sono On
Il codice [IMG] è On
Il codice HTML è Off
Vai al Forum


Tutti gli orari sono GMT +1. Ora sono le: 23:30.


Powered by vBulletin® Version 3.6.4
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
Served by www3v