Τι είναι η μνήμη ECC. Τι είναι το ECC RAM; Αποθηκευμένη μνήμη RAM - τι είναι; μνήμη με δυνατότητα ecc

Στην ερώτηση Εξηγήστε τι είναι η "υποστήριξη ECC" στη μνήμη RAM, που δίνεται από τον συγγραφέα Η Αλιόνκαη καλύτερη απάντηση είναι είναι μια συνάρτηση διόρθωσης σφαλμάτων. τέτοια μνήμη τοποθετείται σε διακομιστές, επειδή είναι αδύνατο να καθυστερήσουν, να απενεργοποιηθούν ή να υπερφορτωθούν λόγω σφαλμάτων. για έναν οικιακό υπολογιστή, αυτό δεν είναι απαραίτητο, αν και είναι χρήσιμο. Εάν αποφασίσετε να εγκαταστήσετε ένα για τον εαυτό σας, βεβαιωθείτε ότι η μητρική σας υποστηρίζει αυτόν τον τύπο μνήμης RAM με ECC.
Πηγή: ku

Απάντηση από Βροχερός[γκουρού]
ECC (Error Correct Code) - ανίχνευση και διόρθωση σφαλμάτων (είναι δυνατές και άλλες ερμηνείες της ίδιας συντομογραφίας) - ένας αλγόριθμος που αντικατέστησε τον "έλεγχος ισοτιμίας". Σε αντίθεση με το τελευταίο, κάθε bit περιλαμβάνεται σε περισσότερα από ένα άθροισμα ελέγχου, το οποίο επιτρέπει, σε περίπτωση σφάλματος σε ένα bit, να επαναφέρετε τη διεύθυνση σφάλματος και να το διορθώσετε. Κατά κανόνα, ανιχνεύονται επίσης σφάλματα σε δύο bit, αν και δεν διορθώνονται. Για την υλοποίηση αυτών των δυνατοτήτων, ένα πρόσθετο τσιπ μνήμης εγκαθίσταται στη μονάδα και γίνεται 72-bit, σε αντίθεση με τα 64 bit δεδομένων μιας συμβατικής μονάδας. Το ECC υποστηρίζεται από όλες τις σύγχρονες μητρικές πλακέτες που έχουν σχεδιαστεί για λύσεις διακομιστών, καθώς και από ορισμένα chipset «γενικής χρήσης». Ορισμένοι τύποι μνήμης (Registered, Full Buffered) είναι διαθέσιμοι μόνο στην έκδοση ECC. Θα πρέπει να σημειωθεί ότι το ECC δεν αποτελεί πανάκεια για την ελαττωματική μνήμη και χρησιμοποιείται για τη διόρθωση τυχαίων σφαλμάτων, μειώνοντας τον κίνδυνο δυσλειτουργιών του υπολογιστή από τυχαίες αλλαγές στο περιεχόμενο των κυψελών μνήμης που προκαλούνται από εξωτερικούς παράγοντες όπως η ακτινοβολία υποβάθρου.
Οι καταχωρημένες μονάδες μνήμης συνιστώνται για χρήση σε συστήματα που απαιτούν (ή υποστηρίζουν) 4 GB ή μεγαλύτερη μνήμη RAM. Είναι πάντα 72 bit, δηλαδή είναι μονάδες ECC και περιέχουν πρόσθετα τσιπ καταχωρητών για μερική αποθήκευση.
PLL-Phase Locked Loop - κύκλωμα αυτόματου συντονισμού φάσης συχνότητας και σήματος, χρησιμεύει για τη μείωση του ηλεκτρικού φορτίου στον ελεγκτή μνήμης και την αύξηση της σταθερότητας κατά τη χρήση μεγάλου αριθμού τσιπ μνήμης, χρησιμοποιείται σε όλες τις μονάδες μνήμης προσωρινής αποθήκευσης.
Buffered - buffered module. Λόγω της υψηλής συνολικής ηλεκτρικής χωρητικότητας των σημερινών μονάδων μνήμης, οι μεγάλοι χρόνοι «φόρτισης» τους έχουν ως αποτέλεσμα χρονοβόρες λειτουργίες εγγραφής. Για να αποφευχθεί αυτό, ορισμένες μονάδες (συνήθως DIMM 168 ακίδων) είναι εξοπλισμένες με ένα ειδικό τσιπ (buffer) που αποθηκεύει τα εισερχόμενα δεδομένα σχετικά γρήγορα, γεγονός που απελευθερώνει τον ελεγκτή. Τα DIMM με προσωρινή μνήμη είναι γενικά ασύμβατα με τα μη προσωρινά. Οι μονάδες με μερική προσωρινή αποθήκευση ονομάζονται επίσης "Εγγεγραμμένες" λειτουργικές μονάδες και οι μονάδες Πλήρους προσωρινής αποθήκευσης ονομάζονται "FB-DIMM". Σε αυτήν την περίπτωση, το "unbuffered" αναφέρεται σε συνηθισμένες μονάδες μνήμης χωρίς εγκαταστάσεις προσωρινής αποθήκευσης.
Ισοτιμία - ισοτιμία, ενότητες με ισοτιμία, επίσης ισοτιμία. Μια μάλλον παλιά αρχή του ελέγχου της ακεραιότητας των δεδομένων. Η ουσία της μεθόδου είναι ότι για το byte δεδομένων στο στάδιο της εγγραφής, υπολογίζεται ένα άθροισμα ελέγχου, το οποίο αποθηκεύεται ως ειδικό bit ισοτιμίας σε ξεχωριστό τσιπ. Όταν διαβάζονται τα δεδομένα, το άθροισμα ελέγχου υπολογίζεται ξανά και συγκρίνεται με το bit ισοτιμίας. Εάν ταιριάζουν, τα δεδομένα θεωρούνται αυθεντικά, διαφορετικά δημιουργείται ένα μήνυμα σφάλματος ισοτιμίας (συνήθως οδηγεί σε διακοπή του συστήματος). Τα προφανή μειονεκτήματα της μεθόδου περιλαμβάνουν το υψηλό κόστος της μνήμης που απαιτείται για την αποθήκευση επιπλέον bits ισοτιμίας, την ευπάθεια σε διπλά σφάλματα (καθώς και τα ψευδώς θετικά σε περίπτωση σφάλματος στο bit ισοτιμίας), τον τερματισμό λειτουργίας του συστήματος ακόμη και με ένα μικρό σφάλμα (π. σε καρέ βίντεο). Επί του παρόντος δεν ισχύει.
SPD - ένα τσιπ σε μια μονάδα μνήμης DIMM που περιέχει όλα τα δεδομένα σχετικά με αυτήν (ιδίως πληροφορίες σχετικά με την ταχύτητα) που είναι απαραίτητα για την παροχή κανονική λειτουργία. Αυτά τα δεδομένα διαβάζονται στο στάδιο του αυτοδιαγνωστικού ελέγχου του υπολογιστή, πολύ πριν από τη φόρτωση του λειτουργικού συστήματος, και σας επιτρέπουν να διαμορφώσετε τις ρυθμίσεις πρόσβασης στη μνήμη, ακόμη και αν υπάρχουν ταυτόχρονα διαφορετικές μονάδες μνήμης στο σύστημα. Ορισμένες μητρικές αρνούνται να εργαστούν με μονάδες που δεν διαθέτουν τσιπ SPD, αλλά τέτοιες μονάδες είναι πλέον πολύ σπάνιες και είναι κυρίως μονάδες PC-66.


Απάντηση από Mowgley[γκουρού]
έλεγχος μνήμης για σφάλματα

Όπως καταλαβαίνω, τα επιχειρήματά του είναι τα εξής:

  1. Η Google δεν χρησιμοποίησε το ECC όταν κατασκεύασε τους διακομιστές της το 1999.
  2. Τα περισσότερα σφάλματα RAM είναι συστηματικά σφάλματα, όχι τυχαία.
  3. Τα σφάλματα RAM είναι σπάνια γιατί Σκεύη, εξαρτήματαβελτιωμένη.
  4. Εάν η μνήμη ECC ήταν πραγματικά σημαντική, τότε θα χρησιμοποιούταν παντού, όχι μόνο σε διακομιστές. Η πληρωμή για αυτό το είδος προαιρετικού υλικού είναι σαφώς πολύ αμφίβολη.
Ας δούμε αυτά τα επιχειρήματα ένα προς ένα:

1. Η Google δεν χρησιμοποίησε το ECC το 1999

Εάν κάνετε κάτι μόνο και μόνο επειδή το έκανε κάποτε η Google, δοκιμάστε:

Α. Τοποθετήστε τους διακομιστές σας σε εμπορευματοκιβώτια αποστολής.

Σήμερα εξακολουθούν να γράφουν άρθρα ότι αυτή είναι μια εξαιρετική ιδέα, αν και η Google μόλις έκανε ένα πείραμα που θεωρήθηκε αποτυχημένο. Αποδεικνύεται ότι ακόμη και τα πειράματα της Google δεν λειτουργούν πάντα. Στην πραγματικότητα, η περιβόητη αγάπη τους για τα «επαναστατικά έργα» («loonshots») σημαίνει ότι έχουν περισσότερα αποτυχημένα πειράματα από τις περισσότερες εταιρείες. Κατά τη γνώμη μου, αυτό είναι ένα σημαντικό ανταγωνιστικό πλεονέκτημα για αυτούς. Μην κάνετε αυτό το πλεονέκτημα μεγαλύτερο από ό,τι είναι αντιγράφοντας τυφλά αποτυχημένα πειράματα.

Β. Ξεκινήστε πυρκαγιές στα δικά σας κέντρα δεδομένων.

Μέρος της ανάρτησης του Atwood περιγράφει πόσο καταπληκτικοί ήταν αυτοί οι διακομιστές:

Κάποιοι μπορεί να ρίξουν μια ματιά σε αυτούς τους πρώτους διακομιστές της Google και να δουν τον αντιεπαγγελματισμό σχετικά με τον κίνδυνο πυρκαγιάς. Οχι εγώ. Βλέπω εδώ μια οραματική κατανόηση του τρόπου με τον οποίο το χαμηλού κόστους, μη διαθέσιμο υλικό θα διαμορφώσει το σύγχρονο Διαδίκτυο.

Το τελευταίο μέρος των όσων ειπώθηκαν είναι αλήθεια. Αλλά στο πρώτο μέρος υπάρχει κάποια αλήθεια. Όταν η Google άρχισε να σχεδιάζει τους δικούς της πίνακες, μια γενιά από αυτές είχε ένα πρόβλημα «ανάπτυξης» ( ) που προκάλεσε μη μηδενικό αριθμό πυρκαγιών.

Παρεμπιπτόντως, αν πάτε στη δημοσίευση του Jeff και δείτε τη φωτογραφία που αναφέρεται στο απόσπασμα, θα δείτε ότι υπάρχουν πολλά καλώδια άλτης στις σανίδες. Αυτό προκάλεσε προβλήματα και διορθώθηκε στην επόμενη γενιά υλικού. Μπορείτε επίσης να δείτε κάποια μάλλον ατημέλητη καλωδίωση, η οποία επιπλέον προκάλεσε προβλήματα και επιδιορθώθηκε επίσης γρήγορα. Υπήρχαν και άλλα προβλήματα, αλλά θα τα αφήσω ως άσκηση για τον αναγνώστη.

Γ. Δημιουργήστε διακομιστές που τραυματίζουν τους υπαλλήλους σας

Οι αιχμηρές άκρες μιας γενιάς διακομιστών της Google τους έχουν κερδίσει τη φήμη ότι είναι «ξυράφι και μίσος».

Δ. Δημιουργήστε τον δικό σας καιρό στα κέντρα δεδομένων σας

Μετά από συνομιλία με τους υπαλλήλους πολλών μεγάλων εταιρειών τεχνολογίας, φαίνεται ότι οι περισσότερες εταιρείες ήταν τόσο ελεγχόμενες από το κλίμα που σχηματίστηκαν σύννεφα ή ομίχλη στα κέντρα δεδομένων τους. Θα μπορούσατε να το ονομάσετε υπολογισμένο και δόλιο σχέδιο της Google για την αναπαραγωγή του καιρού στο Σιάτλ για τη λαθροθηρία των υπαλλήλων της Microsoft. Εναλλακτικά, θα μπορούσε να είναι ένα σχέδιο δημιουργίας κυριολεκτικά «υπολογιστικού νέφους». Ή μήπως όχι.

Λάβετε υπόψη ότι όλα όσα υποδεικνύονται από την Google δοκιμάστηκαν και στη συνέχεια άλλαξαν. Το να κάνετε λάθη και στη συνέχεια να τα διορθώνετε είναι σύνηθες φαινόμενο σε κάθε επιτυχημένο αναπτυξιακό οργανισμό. Εάν λατρεύετε την πρακτική της μηχανικής, τότε θα πρέπει τουλάχιστον να κρατήσετε τη σύγχρονη πρακτική και όχι από αυτό που έγινε το 1999.

Όταν η Google χρησιμοποίησε διακομιστές που δεν ήταν ECC το 1999, εμφάνισαν ορισμένα συμπτώματα που τελικά διαπιστώθηκε ότι ήταν καταστροφή της μνήμης. Συμπεριλαμβανομένου ενός ευρετηρίου αναζήτησης που επέστρεφε ουσιαστικά τυχαία αποτελέσματα σε ερωτήματα. Η πραγματική λειτουργία αποτυχίας εδώ είναι διδακτική. Συχνά ακούω ότι το ECC μπορεί να αγνοηθεί σε αυτά τα μηχανήματα επειδή τα σφάλματα σε μεμονωμένα αποτελέσματα είναι αποδεκτά. Αλλά ακόμα κι αν θεωρείτε αποδεκτά τα τυχαία σφάλματα, η αγνόησή τους σημαίνει ότι υπάρχει κίνδυνος πλήρους καταστροφής των δεδομένων, εκτός εάν πραγματοποιηθεί προσεκτική ανάλυση για να βεβαιωθείτε ότι ένα σφάλμα μπορεί να παραμορφώσει ελαφρά μόνο ένα αποτέλεσμα.

Σε μελέτες που πραγματοποιήθηκαν στις συστήματα αρχείωναχ, έχει αποδειχθεί επανειλημμένα ότι, παρά τις ηρωικές προσπάθειες δημιουργίας συστημάτων που είναι ανθεκτικά σε ένα μόνο σφάλμα, είναι εξαιρετικά δύσκολο να γίνει αυτό. Ουσιαστικά, κάθε σύστημα αρχείων που έχει δοκιμαστεί σε μεγάλο βαθμό μπορεί να έχει μεγάλη αποτυχία λόγω ενός μόνο σφάλματος (). Δεν πρόκειται να επιτεθώ σε προγραμματιστές συστημάτων αρχείων. Είναι καλύτεροι σε αυτό το είδος ανάλυσης από το 99,9% των προγραμματιστών. Απλώς το πρόβλημα έχει επανειλημμένα αποδειχθεί τόσο δύσκολο που οι άνθρωποι δεν μπορούν εύλογα να το συζητήσουν, και ένα αυτοματοποιημένο εργαλείο για μια τέτοια ανάλυση απέχει ακόμα πολύ από το να είναι ένα απλό πάτημα ενός κουμπιού. Στο εγχειρίδιο Warehouse Computer Handbook, η Google συζητά τον εντοπισμό και τη διόρθωση σφαλμάτων και η μνήμη ECC θεωρείται η καλύτερη επιλογή όταν είναι προφανές ότι πρέπει να χρησιμοποιηθεί διόρθωση σφαλμάτων υλικού ( ).

Η Google έχει εξαιρετική υποδομή. Από όσα έχω ακούσει για τις υποδομές σε άλλες μεγάλες εταιρείες τεχνολογίας, η Google φαίνεται να είναι η καλύτερη στον κόσμο. Αλλά αυτό δεν σημαίνει ότι πρέπει να αντιγράψετε όλα όσα κάνουν. Ακόμα κι αν ληφθούν υπόψη μόνο οι καλές τους ιδέες, δεν έχει νόημα για τις περισσότερες εταιρείες να τις αντιγράφουν. Δημιούργησαν μια αντικατάσταση για τον προγραμματιστή εργασιών Linux που χρησιμοποιεί πληροφορίες χρόνου εκτέλεσης υλικού και στατικά ίχνη για να τους επιτρέψει να επωφεληθούν από το νέο υλικό σε επεξεργαστές διακομιστών Intel, επιτρέποντας τη δυναμική κατάτμηση της κρυφής μνήμης μεταξύ των πυρήνων. Εάν το χρησιμοποιήσετε σε όλο το υλικό της, η Google θα εξοικονομήσει περισσότερα χρήματα σε μια εβδομάδα από όσα έχει ξοδέψει το Stack Exchange σε όλους τους υπολογιστές της σε ολόκληρη την ιστορία της. Αυτό σημαίνει ότι πρέπει να αντιγράψετε το Google; Όχι, εκτός αν έχετε ήδη χτυπήσει μάννα από τον παράδεισο, όπως η βασική υποδομή σας γραμμένη σε εξαιρετικά βελτιστοποιημένη C++ αντί για Java ή (Θεός φυλάξοι) Ruby. Και το γεγονός είναι ότι για τη συντριπτική πλειοψηφία των εταιρειών, η σύνταξη προγραμμάτων σε μια γλώσσα που συνεπάγεται 20πλάσια μείωση της παραγωγικότητας είναι μια απολύτως λογική απόφαση.

2. Τα περισσότερα σφάλματα RAM είναι συστηματικά σφάλματα

Το επιχείρημα κατά του ECC αναπαράγει την ακόλουθη ενότητα της μελέτης σφαλμάτων DRAM (η έμφαση προστέθηκε από τον Jeff):
Η μελέτη μας έχει πολλά κύρια αποτελέσματα. Πρώτον, διαπιστώσαμε ότι περίπου το 70% των αστοχιών DRAM είναι επαναλαμβανόμενες (π.χ. μόνιμες) βλάβες, ενώ μόνο το 30% είναι διακοπτόμενες (διακοπτόμενες) βλάβες. Δεύτερον, διαπιστώσαμε ότι οι μεγάλες αποτυχίες πολλών bit, όπως οι αποτυχίες που επηρεάζουν μια ολόκληρη σειρά, στήλη ή μπλοκ, ευθύνονται για πάνω από το 40% όλων των αστοχιών DRAM. Τρίτον, διαπιστώσαμε ότι σχεδόν το 5% των αστοχιών DRAM επηρεάζουν τα κυκλώματα σε επίπεδο πλακέτας, όπως γραμμές δεδομένων (DQ) ή πύλης (DQS). Τέλος, διαπιστώσαμε ότι η δυνατότητα Chipkill μείωσε τη συχνότητα των αστοχιών συστήματος που προκαλούνται από αστοχίες DRAM κατά 36.

Το απόσπασμα φαίνεται κάπως ειρωνικό, καθώς δεν φαίνεται να είναι ένα επιχείρημα κατά του ECC, αλλά ένα επιχείρημα για το Chipkill - μια συγκεκριμένη κατηγορία ECC. Παραμερίζοντας αυτό, η ανάρτηση του Jeff δείχνει ότι τα συστηματικά σφάλματα είναι δύο φορές πιο συχνά από τα τυχαία σφάλματα. Στη συνέχεια, η ανάρτηση λέει ότι εκτελούν το memtest στους υπολογιστές τους όταν συμβαίνουν συστηματικά σφάλματα.

Πρώτον, η αναλογία 2:1 δεν είναι αρκετά μεγάλη για να αγνοήσει απλά τυχαία σφάλματα. Δεύτερον, η ανάρτηση υπονοεί την πεποίθηση του Jeff ότι τα συστηματικά σφάλματα είναι ουσιαστικά αμετάβλητα και δεν μπορούν να εμφανιστούν μετά από λίγο. Αυτό δεν είναι αληθινό. Τα ηλεκτρονικά φθείρονται με τον ίδιο τρόπο που φθείρονται οι μηχανικές συσκευές. Οι μηχανισμοί είναι διαφορετικοί, αλλά τα αποτελέσματα είναι παρόμοια. Πράγματι, αν συγκρίνουμε την ανάλυση αξιοπιστίας τσιπ με άλλους τύπους ανάλυσης αξιοπιστίας, μπορούμε να δούμε ότι συχνά χρησιμοποιούν τις ίδιες οικογένειες διανομών για μοντελοποίηση αστοχιών. Τρίτον, η συλλογιστική του Jeff υπονοεί ότι το ECC δεν μπορεί να βοηθήσει στον εντοπισμό ή την επιδιόρθωση σφαλμάτων, κάτι που όχι μόνο είναι λάθος, αλλά έρχεται σε άμεση αντίθεση με το απόσπασμα.

Λοιπόν, πόσο συχνά θα εκτελείτε το memtest στους υπολογιστές σας σε μια προσπάθεια να εντοπίσετε αυτά τα σφάλματα συστήματος και πόση απώλεια δεδομένων είστε διατεθειμένοι να υπομείνετε; Μία από τις βασικές χρήσεις του ECC δεν είναι η διόρθωση σφαλμάτων, αλλά η σηματοδότηση σφαλμάτων έτσι ώστε το υλικό να μπορεί να αντικατασταθεί πριν εμφανιστεί "σιωπηλή καταστροφή". Ποιος θα συμφωνούσε να κλείνει τα πάντα στο μηχάνημα κάθε μέρα για να τρέχει το memtest; Θα ήταν πολύ πιο ακριβό από την απλή αγορά μνήμης ECC. Και ακόμα κι αν μπορούσατε να με πείσετε να εκτελέσω μια δοκιμή μνήμης, το memtest δεν θα έβρισκε τόσα σφάλματα όσα μπορεί το ECC.

Όταν δούλευα για μια εταιρεία με στόλο περίπου χιλίων μηχανημάτων, παρατηρήσαμε ότι είχαμε περίεργες αποτυχίες ελέγχου ακεραιότητας δεδομένων και μετά από περίπου έξι μήνες, συνειδητοποιήσαμε ότι οι αστοχίες σε ορισμένα μηχανήματα ήταν πιο πιθανές από άλλες. Αυτές οι αποτυχίες ήταν αρκετά σπάνιες (ίσως μερικές φορές την εβδομάδα κατά μέσο όρο), οπότε χρειάστηκε πολύς χρόνος για να συγκεντρωθούν πληροφορίες και να καταλάβουμε τι συνέβαινε. Χωρίς να γνωρίζουμε την αιτία, η ανάλυση των αρχείων καταγραφής για να δούμε αν τα σφάλματα προκλήθηκαν από ανατροπές ενός bit (με μεγάλη πιθανότητα) ήταν επίσης μη τετριμμένη. Ήμασταν τυχεροί που, ως παρενέργεια της διαδικασίας που χρησιμοποιούσαμε, τα αθροίσματα ελέγχου υπολογίστηκαν σε ξεχωριστή διαδικασία σε διαφορετικό μηχάνημα σε διαφορετικές χρονικές στιγμές, έτσι ώστε ένα σφάλμα να μην μπορεί να αλλοιώσει το αποτέλεσμα και να διαδώσει αυτή τη διαφθορά στο άθροισμα ελέγχου.

Εάν προσπαθείτε απλώς να προστατεύσετε τον εαυτό σας με αθροίσματα ελέγχου στη μνήμη, υπάρχει μεγάλη πιθανότητα να εκτελέσετε μια λειτουργία αθροίσματος ελέγχου σε ήδη κατεστραμμένα δεδομένα και να λάβετε το σωστό άθροισμα ελέγχου των κακών δεδομένων, εκτός εάν κάνετε μερικούς πολύ φανταχτερούς υπολογισμούς που δίνουν τα δικά τους αθροίσματα ελέγχου. Και αν σκέφτεστε σοβαρά τη διόρθωση σφαλμάτων, τότε πιθανότατα εξακολουθείτε να χρησιμοποιείτε το ECC.

Τέλος πάντων, μετά την ολοκλήρωση της ανάλυσης, διαπιστώσαμε ότι το memtest δεν μπορούσε να εντοπίσει προβλήματα, αλλά η αντικατάσταση της μνήμης RAM σε κακές μηχανές οδήγησε σε μείωση του ποσοστού σφάλματος κατά μία έως δύο τάξεις μεγέθους. Οι περισσότερες υπηρεσίες δεν έχουν το είδος των αθροισμάτων ελέγχου που είχαμε. Αυτές οι υπηρεσίες απλώς θα γράφουν σιωπηλά κατεστραμμένα δεδομένα σε μόνιμη αποθήκευση και δεν θα δουν το πρόβλημα μέχρι να παραπονεθεί ο πελάτης.

3. Λόγω της ανάπτυξης του υλικού, τα σφάλματα έχουν γίνει πολύ σπάνια.

Τα στοιχεία της ανάρτησης δεν αρκούν για μια τέτοια δήλωση. Σημειώστε ότι καθώς η χρήση της μνήμης RAM αυξάνεται και συνεχίζει να αυξάνεται εκθετικά, οι αποτυχίες της μνήμης RAM πρέπει να μειωθούν με μεγαλύτερο εκθετικό ρυθμό για να μειωθεί πραγματικά η συχνότητα καταστροφής δεδομένων. Επίσης, καθώς τα τσιπ συνεχίζουν να γίνονται μικρότερα, τα κύτταρα γίνονται μικρότερα, καθιστώντας τα θέματα φθοράς που συζητήθηκαν στο δεύτερο σημείο πιο σχετικά. Για παράδειγμα, με την τεχνολογία 20 nm, ένας πυκνωτής DRAM μπορεί να συσσωρεύσει κάπου 50 ηλεκτρόνια και αυτός ο αριθμός θα είναι μικρότερος για την επόμενη γενιά DRAM ενώ θα συνεχίσει να μειώνεται.

Μια άλλη σημείωση: όταν πληρώνετε για ECC, δεν πληρώνετε μόνο για τη μνήμη ECC - πληρώνετε για εξαρτήματα (επεξεργαστές, πλακέτες) υψηλότερης ποιότητας. Αυτό μπορεί εύκολα να φανεί με τα ποσοστά αστοχίας μονάδας δίσκου, και έχω ακούσει πολλούς ανθρώπους να το παρατηρούν στις προσωπικές τους παρατηρήσεις.

Για να παραθέσω δημόσια διαθέσιμη έρευνα, απ' όσο θυμάμαι, η ομάδα του Andrea και του Ramsey κυκλοφόρησε το χαρτί SIGMETRICS πριν από μερικά χρόνια, το οποίο έδειξε ότι μια μονάδα SATA είχε 4 φορές περισσότερες πιθανότητες να αποτύχει σε μια ανάγνωση από μια μονάδα SCSI και 10 φορές πιο πιθανό να έχει κρυφά δεδομένα καταστροφής. . Αυτή η αναλογία διατηρήθηκε ακόμη και όταν χρησιμοποιούνται δίσκοι από τον ίδιο κατασκευαστή. Δεν υπάρχει ιδιαίτερος λόγος να πιστεύουμε ότι η διεπαφή SCSI θα πρέπει να είναι πιο αξιόπιστη από τη διεπαφή SATA, αλλά δεν πρόκειται για τη διεπαφή. Μιλάμε για την αγορά εξαιρετικά αξιόπιστων στοιχείων διακομιστή σε σύγκριση με αυτά των πελατών. Ίσως δεν σας ενδιαφέρει συγκεκριμένα η αξιοπιστία του δίσκου, επειδή έχετε τα πάντα στα αθροίσματα ελέγχου και η ζημιά εντοπίζεται εύκολα, αλλά υπάρχουν ορισμένοι τύποι παραβιάσεων που είναι πιο δύσκολο να εντοπιστούν.

4. Εάν η μνήμη ECC ήταν πραγματικά σημαντική, τότε θα χρησιμοποιούταν παντού, όχι μόνο σε διακομιστές.

Για να παραφράσουμε ελαφρώς αυτό το επιχείρημα, μπορούμε να πούμε ότι "αν αυτό το χαρακτηριστικό ήταν πραγματικά σημαντικό για διακομιστές, τότε θα χρησιμοποιούνταν και σε μη διακομιστές." Μπορείτε να εφαρμόσετε αυτό το όρισμα σε μεγάλο μέρος του υλικού διακομιστή. Στην πραγματικότητα, αυτό είναι ένα από τα πιο απογοητευτικά προβλήματα που αντιμετωπίζουν οι μεγάλοι πάροχοι cloud.

Έχουν αρκετή μόχλευση για να αποκτήσουν τα περισσότερα εξαρτήματα στη σωστή τιμή. Αλλά η διαπραγμάτευση θα λειτουργήσει μόνο όταν υπάρχουν περισσότεροι από ένας βιώσιμοι προμηθευτές.

Ένας από τους λίγους τομείς όπου δεν υπάρχουν βιώσιμοι ανταγωνιστές είναι η παραγωγή κεντρικών μονάδων επεξεργασίας και επιταχυντών βίντεο. Ευτυχώς για τους μεγάλους προμηθευτές, συνήθως δεν χρειάζονται επιταχυντές βίντεο, χρειάζονται επεξεργαστές, πολύ - αυτό συμβαίνει εδώ και πολύ καιρό. Υπήρξαν αρκετές προσπάθειες από προμηθευτές επεξεργαστών να εισέλθουν στην αγορά διακομιστών, αλλά κάθε τέτοια προσπάθεια είχε πάντα μοιραία ελαττώματα από την αρχή, καθιστώντας προφανές ότι ήταν καταδικασμένη (και αυτά είναι συχνά έργα που απαιτούν τουλάχιστον 5 χρόνια, δηλ. ήταν απαραίτητο να περάσετε πολύ χρόνο χωρίς εμπιστοσύνη στην επιτυχία).

Οι προσπάθειες της Qualcomm έχουν λάβει πολύ θόρυβο, αλλά όταν μιλάω με τις επαφές μου στην Qualcomm, όλοι μου λένε ότι το τσιπ που κατασκευάζεται αυτή τη στιγμή είναι ουσιαστικά για δοκιμή. Συνέβη επειδή η Qualcomm χρειαζόταν να μάθει πώς να φτιάχνει ένα τσιπ διακομιστή από όλους τους ανθρώπους που είχε ψάξει από την IBM και ότι το επόμενο τσιπ θα ήταν το πρώτο που θα μπορούσε να είναι ανταγωνιστικό. Τρέφω μεγάλες ελπίδες για την Qualcomm, καθώς και για τις προσπάθειες της ARM να δημιουργήσει καλά στοιχεία διακομιστή, αλλά αυτές οι προσπάθειες δεν έχουν ακόμη αποδώσει το επιθυμητό αποτέλεσμα.

Η σχεδόν πλήρης ακαταλληλότητα των τρεχουσών επιλογών ARM (και POWER) (εκτός από τις υποθετικές επιλογές για το εντυπωσιακό τσιπ ARM ​​της Apple) για τους περισσότερους φόρτους εργασίας διακομιστών όσον αφορά την απόδοση ανά δολάριο του συνολικού κόστους ιδιοκτησίας (TCO) είναι ένα θέμα λίγο άγνωστο. , οπότε θα το αφήσω προς το παρόν. άλλη δημοσίευση. Αλλά το θέμα είναι ότι η Intel έχει μια θέση στην αγορά που μπορεί να αναγκάσει τους ανθρώπους να πληρώσουν επιπλέον για τις λειτουργίες διακομιστή. Και η Intel το κάνει. Επίσης, ορισμένες λειτουργίες είναι πραγματικά πιο σημαντικές για διακομιστές παρά για κινητές συσκευέςμε αρκετά gigabyte μνήμης RAM και ενεργειακό προϋπολογισμό πολλών βατ, κινητές συσκευές που αναμένεται να διακοπούν περιοδικά και να επανεκκινηθούν.

συμπέρασμα

Πρέπει να αγοράσω ECC RAM; Εξαρτάται από πολλά πράγματα. Για διακομιστές, αυτή είναι πιθανώς μια καλή επιλογή λαμβάνοντας υπόψη το κόστος. Ωστόσο, είναι πραγματικά δύσκολο να κάνετε μια ανάλυση κόστους/οφέλους, επειδή είναι πολύ δύσκολο να προσδιορίσετε το κόστος της καταστροφής λανθάνοντων δεδομένων ή το κόστος του κινδύνου απώλειας μισού έτους από το χρόνο ενός προγραμματιστή για την ανίχνευση διαλείπουσας λειτουργίας, μόνο για να διαπιστώσετε ότι προκαλούνται από χρήση μνήμης χωρίς ECC.

Για επιτραπέζιους υπολογιστές, είμαι επίσης υποστηρικτής του ECC. Αλλά αν δεν δημιουργείτε τακτικά αντίγραφα ασφαλείας, τότε είναι πιο χρήσιμο για εσάς να επενδύσετε σε κανονικά αντίγραφα ασφαλείας παρά στη μνήμη ECC. Και αν έχετε αντίγραφα ασφαλείαςχωρίς ECC, τότε μπορείτε εύκολα να γράψετε κατεστραμμένα δεδομένα στην κύρια αποθήκευση και να αναπαράγετε αυτά τα κατεστραμμένα δεδομένα στο αντίγραφο ασφαλείας.

Ευχαριστώ τους Prabhakar Ragda, Tom Murphy, Jay Weiskopf, Leah Hanson, Joe Wilder και Ralph Corderoy για συζήτηση/σχόλια/διορθώσεις. Επίσης, ευχαριστώ (ή ίσως όχι) τη Λία που με έπεισε να γράψω αυτό το προφορικό αυτοσχέδιο ως ανάρτηση ιστολογίου. Ζητούμε συγγνώμη για τυχόν λάθη, έλλειψη αναφορών και εξαιρετική πεζογραφία. Αυτή είναι ουσιαστικά μια καταγραφή της μισής συζήτησης και δεν εξήγησα τους όρους, δεν παρείχα συνδέσμους ή έλεγξα τα γεγονότα στο επίπεδο λεπτομέρειας που κάνω συνήθως.

Ένα αστείο παράδειγμα είναι (για μένα τουλάχιστον) ο μαγικός αυτο-θεραπευόμενος εύτηκτος σύνδεσμος. Αν και υπάρχουν πολλές υλοποιήσεις, φανταστείτε έναν εύτηκτο σύνδεσμο σε ένα τσιπ ως ένα είδος αντίστασης. Εάν περάσετε κάποιο ρεύμα μέσω αυτού, τότε θα πρέπει να αποκτήσετε σύνδεση. Εάν το ρεύμα είναι πολύ υψηλό, η αντίσταση θα θερμανθεί και τελικά θα σπάσει. Αυτό χρησιμοποιείται συνήθως για την απενεργοποίηση στοιχείων σε μάρκες ή για δραστηριότητες όπως η ρύθμιση της ταχύτητας του ρολογιού. Η βασική αρχή είναι ότι αφού καεί ο βραχυκυκλωτήρας, δεν υπάρχει τρόπος να το επαναφέρετε στην αρχική του κατάσταση.

Πριν από πολύ καιρό υπήρχε ένας κατασκευαστής ημιαγωγών που ήταν λίγο βιαστικός με τη διαδικασία κατασκευής του και κάπως υπερβολικά μείωσε τις ανοχές σε μια συγκεκριμένη γενιά τεχνολογίας. Μετά από λίγους μήνες (ή χρόνια), η σύνδεση μεταξύ των δύο άκρων ενός τέτοιου βραχυκυκλωτήρα μπόρεσε να εμφανιστεί ξανά και να τον αποκαταστήσει. Εάν είστε τυχεροί, ένας τέτοιος βραχυκυκλωτήρας θα είναι κάτι σαν το πιο σημαντικό κομμάτι του πολλαπλασιαστή ρολογιού, το οποίο, αν αλλάξει, θα απενεργοποιήσει το τσιπ. Εάν δεν είστε τυχεροί, θα οδηγήσει σε καταστροφή κρυφών δεδομένων.

Άκουσα από πολλούς ανθρώπους σε διαφορετικές εταιρείες για τα προβλήματα αυτής της τεχνολογικής γενιάς αυτού του κατασκευαστή, επομένως δεν ήταν μεμονωμένες περιπτώσεις. Όταν λέω ότι είναι αστείο, εννοώ ότι είναι αστείο να ακούς αυτή την ιστορία σε ένα μπαρ. Είναι λιγότερο αστείο να ανακαλύπτετε μετά από ένα χρόνο δοκιμών ότι ορισμένες από τις μάρκες σας δεν λειτουργούν επειδή οι ρυθμίσεις τους στο jumper δεν έχουν νόημα και πρέπει να επαναλάβετε το τσιπ σας και να καθυστερήσετε την κυκλοφορία κατά 3 μήνες. Παρεμπιπτόντως, αυτή η κατάσταση ανάκτησης εύτηκτου συνδέσμου είναι ένα άλλο παράδειγμα μιας κατηγορίας σφαλμάτων που μπορούν να μετριαστούν με το ECC.

Αυτό δεν είναι ζήτημα της Google. Το αναφέρω μόνο επειδή πολλοί από τους ανθρώπους με τους οποίους μιλάω εκπλήσσονται με το πώς μπορεί να αποτύχει το υλικό.

Αν δεν θέλετε να σκάψετε ολόκληρο το βιβλίο, τότε εδώ είναι το απόσπασμα:

Σε ένα σύστημα που μπορεί να αντέξει μια σειρά αστοχιών σε επίπεδο λογισμικού, η ελάχιστη απαίτηση για το τμήμα υλικού είναι να εντοπίζονται και να αναφέρονται πάντα οι αστοχίες αυτού του τμήματος. λογισμικόαρκετά έγκαιρα ώστε να επιτραπεί στην υποδομή λογισμικού να τα συγκρατήσει και να προβεί στις κατάλληλες ενέργειες ανάκτησης. Δεν είναι απαραίτητο το υλικό να χειρίζεται ρητά όλες τις αστοχίες. Αυτό δεν σημαίνει ότι το υλικό για τέτοια συστήματα θα πρέπει να σχεδιαστεί χωρίς δυνατότητα διόρθωσης σφαλμάτων. Όποτε η λειτουργία διόρθωσης σφαλμάτων μπορεί να προσφερθεί με λογικό κόστος ή πολυπλοκότητα, η υποστήριξή της συχνά αποδίδει. Αυτό σημαίνει ότι εάν η διόρθωση σφαλμάτων υλικού ήταν εξαιρετικά δαπανηρή, τότε το σύστημα θα μπορούσε να χρησιμοποιήσει μια φθηνότερη έκδοση που παρείχε μόνο δυνατότητες ανίχνευσης. Τα τρέχοντα συστήματα DRAM είναι ένα καλό παράδειγμα μιας κατάστασης στην οποία μπορεί να παρέχεται ισχυρή διόρθωση σφαλμάτων με πολύ χαμηλό πρόσθετο κόστος. Ωστόσο, η χαλάρωση της απαίτησης εντοπισμού σφαλμάτων υλικού θα ήταν πολύ πιο δύσκολη, καθώς θα σήμαινε ότι κάθε στοιχείο λογισμικού θα επιβαρυνόταν με την ανάγκη επαλήθευσης της δικής του σωστής εκτέλεσης. Στο αρχικό στάδιο της ιστορικό googleΈπρεπε να αντιμετωπίσω διακομιστές όπου η DRAM δεν είχε καν ισοτιμία. Η δημιουργία ενός ευρετηρίου αναζήτησης ιστού αποτελείται ουσιαστικά από μια πολύ μεγάλη λειτουργία ταξινόμησης/συγχώνευσης χρησιμοποιώντας πολλαπλές μηχανές σε μήκος. Το 2000, μια από τις μηνιαίες ενημερώσεις ευρετηρίου ιστού της Google απέτυχε στην προεπικύρωση, όταν διαπιστώθηκε ότι ένα υποσύνολο των ερωτημάτων που δοκιμάστηκαν επέστρεφαν έγγραφα, προφανώς τυχαία. Μετά από κάποια έρευνα, βρέθηκε μια κατάσταση στα νέα αρχεία ευρετηρίου που αντιστοιχούσε στη σταθεροποίηση ενός bit στο μηδέν σε μια συγκεκριμένη θέση στις δομές δεδομένων, η οποία ήταν αρνητική παρενέργεια της ροής μεγάλου όγκου δεδομένων μέσω ενός ελαττωματικού τσιπ DRAM. Έλεγχοι συνέπειας προστέθηκαν στις δομές δεδομένων ευρετηρίου για να ελαχιστοποιηθεί η πιθανότητα επανεμφάνισης αυτού του προβλήματος και δεν υπήρξαν περαιτέρω προβλήματα αυτής της φύσης. Ωστόσο, θα πρέπει να σημειωθεί ότι αυτή η μέθοδος δεν εγγυάται 100% ανίχνευση σφάλματος στο πάσο ευρετηρίου, καθώς δεν ελέγχονται όλες οι θέσεις μνήμης - οι οδηγίες, για παράδειγμα, παραμένουν μη ελεγμένες. Αυτό λειτούργησε επειδή οι δομές δεδομένων ευρετηρίου ήταν τόσο μεγαλύτερες από όλα τα άλλα δεδομένα που εμπλέκονται στον υπολογισμό που η παρουσία αυτών των δομών δεδομένων αυτοελέγχου καθιστούσε πολύ πιθανό ότι μηχανήματα με ελαττωματική DRAM θα ​​ταυτοποιηθούν και θα εξαιρεθούν από το σύμπλεγμα. Η επόμενη γενιά μηχανών στην Google περιελάμβανε ήδη ανίχνευση ισοτιμίας μνήμης και μόλις η τιμή της μνήμης ECC έπεσε σε ανταγωνιστικά επίπεδα, όλες οι επόμενες γενιές χρησιμοποίησαν ECC-DRAM.

Ετικέτες: Προσθήκη ετικετών

Επίσης, τα σχήματα προστασίας δεδομένων ECC μπορούν να εφαρμοστούν στη μνήμη που είναι ενσωματωμένη σε μικροεπεξεργαστές: μνήμη cache, αρχείο καταχωρητή. Μερικές φορές ο έλεγχος προστίθεται επίσης στα υπολογιστικά κυκλώματα.

Περιγραφή του προβλήματος

Υπάρχει ανησυχία ότι η τάση προς μικρότερες φυσικές διαστάσεις των μονάδων μνήμης θα οδηγήσει σε αύξηση των ποσοστών σφάλματος λόγω του γεγονότος ότι σωματίδια χαμηλότερης ενέργειας θα μπορούν να αλλάξουν το bit. Από την άλλη πλευρά, το συμπαγές μέγεθος της μνήμης μειώνει την πιθανότητα να μπουν σωματίδια σε αυτήν. Επιπλέον, η μετάβαση σε τεχνολογίες όπως το πυρίτιο σε έναν μονωτή μπορεί να κάνει τη μνήμη πιο σταθερή.

Μια μελέτη που διεξήχθη σε μεγάλο αριθμό διακομιστών Google έδειξε ότι ο αριθμός των σφαλμάτων μπορεί να κυμαίνεται από 25.000 έως 70.000 σφάλματα ανά δισεκατομμύριο ώρες εργασίας (αγγλ. ώρες συσκευής) ανά megabit (δηλαδή, 2,5-7,0 × 10 − 11 σφάλματα / bit hour) .

Τεχνολογία

Μια λύση σε αυτό το πρόβλημα είναι η ισοτιμία - χρησιμοποιώντας ένα επιπλέον bit που καταγράφει την ισοτιμία των υπολοίπων bit. Αυτή η προσέγγιση σάς επιτρέπει να εντοπίζετε σφάλματα, αλλά δεν σας επιτρέπει να τα διορθώσετε. Έτσι, όταν εντοπιστεί ένα σφάλμα, μπορείτε μόνο να διακόψετε την εκτέλεση του προγράμματος.

Μια πιο αξιόπιστη προσέγγιση είναι αυτή που χρησιμοποιεί κωδικούς διόρθωσης σφαλμάτων. Ο πιο συχνά χρησιμοποιούμενος κώδικας διόρθωσης σφαλμάτων είναι ο κώδικας Hamming. Οι περισσότερες μνήμες διόρθωσης σφαλμάτων που χρησιμοποιούνται σε σύγχρονους υπολογιστές μπορούν να διορθώσουν ένα μόνο σφάλμα bit σε μια λέξη μηχανής 64 bit και να εντοπίσουν, αλλά όχι να διορθώσουν, ένα σφάλμα δύο bit σε μία λέξη των 64 bit.

Η πιο αποτελεσματική προσέγγιση για τη διόρθωση σφαλμάτων εξαρτάται από το είδος των αναμενόμενων σφαλμάτων. Συχνά θεωρείται ότι τα διαφορετικά bit αλλάζουν ανεξάρτητα. Σε αυτή την περίπτωση, η πιθανότητα δύο σφαλμάτων σε μία λέξη είναι αμελητέα μικρή. Ωστόσο, αυτή η υπόθεση δεν ισχύει σύγχρονους υπολογιστές. Μνήμη βασισμένη σε τεχνολογία διόρθωσης σφαλμάτων Chipkill(IBM), σας επιτρέπει να διορθώσετε πολλά σφάλματα, συμπεριλαμβανομένης της βλάβης ολόκληρου του τσιπ μνήμης. Άλλες τεχνολογίες διόρθωσης μνήμης που δεν προϋποθέτουν ανεξαρτησία σφαλμάτων σε διαφορετικά bit περιλαμβάνουν Εκτεταμένο ECC(Sun Microsystems), Chipspare(Hewlett-Packard) και SDDC(Intel).

Πολλά παλαιότερα συστήματα δεν ανέφεραν διορθωμένα σφάλματα, ανέφεραν μόνο σφάλματα που εντοπίστηκαν και δεν μπορούσαν να διορθωθούν. Τα σύγχρονα συστήματα καταγράφουν τόσο διορθωμένα σφάλματα (CE, Αγγλικά διορθώσιμα λάθη) όσο και μη διορθώσιμα σφάλματα (UE, Αγγλικά αδιόρθωτα σφάλματα). Αυτό σας επιτρέπει να αντικαταστήσετε την κατεστραμμένη μνήμη εγκαίρως: παρά το γεγονός ότι ένας μεγάλος αριθμός διορθωμένων σφαλμάτων ελλείψει μη διορθώσιμων σφαλμάτων δεν επηρεάζει τη σωστή λειτουργία της μνήμης, αυτό μπορεί να υποδηλώνει ότι για μια δεδομένη μονάδα μνήμης η πιθανότητα μη διορθώσιμων σφαλμάτων θα αυξηθεί στο μέλλον.

Πλεονέκτημα και μειονεκτήματα

Η μνήμη με διόρθωση σφαλμάτων προστατεύει από εσφαλμένη λειτουργία ενός συστήματος υπολογιστή λόγω καταστροφής της μνήμης και μειώνει την πιθανότητα θανατηφόρου βλάβης του συστήματος. Ωστόσο, μια τέτοια μνήμη κοστίζει περισσότερο. η μητρική πλακέτα, το chipset και ο επεξεργαστής που υποστηρίζουν τη μνήμη διόρθωσης σφαλμάτων μπορεί επίσης να είναι πιο ακριβή, επομένως αυτή η μνήμη χρησιμοποιείται σε συστήματα όπου η ομαλή και σωστή λειτουργία είναι σημαντική, όπως διακομιστής αρχείων, επιστημονικές και οικονομικές εφαρμογές.

Η μνήμη για τη διόρθωση σφαλμάτων είναι 2-3% πιο αργή (συχνά απαιτεί έναν επιπλέον κύκλο του ελεγκτή μνήμης για τον έλεγχο των αθροισμάτων) από τη συμβατική μνήμη, ανάλογα με την εφαρμογή. Η πρόσθετη λογική που υλοποιεί την καταμέτρηση, τον έλεγχο ECC και τη διόρθωση σφαλμάτων απαιτεί λογικούς πόρους και χρόνο για να λειτουργήσει είτε στον ίδιο τον ελεγκτή μνήμης είτε στη διεπαφή μεταξύ της CPU και του ελεγκτή μνήμης.

δείτε επίσης

Σημειώσεις

  1. Βέρνερ Φίσερ. Η RAM αποκαλύφθηκε (αόριστος) . admin-magazine.com. Ανακτήθηκε στις 20 Οκτωβρίου 2014.
  2. Αρχειοθετημένο αντίγραφο (αόριστος) (μη διαθέσιμος σύνδεσμος). Ανακτήθηκε στις 20 Νοεμβρίου 2016. Αρχειοθετήθηκε από το πρωτότυπο στις 18 Απριλίου 2016.
  3. Single Event Upset at Ground Level, Eugene Normand, Μέλος, IEEE, Boeing Defense & Space Group, Seattle, WA 98124-2499
  4. "A Survey of Techniques for Modeling and Improving Reliability of Computing Systems", IEEE TPDS, 2015
  5. Kuznetsov VV Ηλιακή-γήινη φυσική (μάθημα διαλέξεων για φοιτητές φυσικής). Διάλεξη 7. Ηλιακή δραστηριότητα. // Ηλιακές καταιγίδες. Κρατικό Πανεπιστήμιο Γκόρνο-Αλτάι. 2012
  6. Gary M. Swift και Steven M. Guertin. "Παρατηρήσεις κατά την πτήση ανατροπής πολλαπλών μπιτ σε DRAM". Εργαστήριο Jet Propulsion
  7. Borucki, "Comparison of Accelerated DRAM Soft Error Rates Measured at Component and System Level", 46th Annual International Reliability Physics Symposium, Phoenix, 2008, pp. 482–487
  8. Schroeder, Bianca; Pinheiro, Eduardo; Weber, Wolf-Dietrich. DRAM Errors in the Wild: A Large-Scale Field Study (απροσδιόριστο) // SIGMETRICS/Performance. - ACM, 2009. - ISBN 978-1-60558-511-6.
  9. Χρήση του StrongArm SA-1110 στον υπολογιστή οχήματος του νανοδορυφόρου (αόριστος) . Διαστημικό Κέντρο Tsinghua, Πανεπιστήμιο Tsinghua, Πεκίνο. Ανακτήθηκε στις 16 Φεβρουαρίου 2009. Αρχειοθετήθηκε από το πρωτότυπο στις 2 Οκτωβρίου 2011.
  10. Doug Thompson, Mauro Carvalho Chehab. "EDAC - Error Detection And Correction" Αρχειοθετήθηκε από το πρωτότυπο στις 5 Σεπτεμβρίου 2009. . 2005-2009. "Ο στόχος της μονάδας πυρήνα "edac" είναι να ανιχνεύει και να αναφέρει σφάλματα που συμβαίνουν στο σύστημα υπολογιστή που εκτελείται σε Linux."
  11. Συζήτηση του ECC στο pcguide (αόριστος) . Pcguide.com (17 Απριλίου 2001). Ανακτήθηκε στις 23 Νοεμβρίου 2011.

Σελίδα 1 από 10

Στον Ιστό, μπορείτε συχνά να δείτε ερωτήσεις σε θεματικά φόρουμ σχετικά με τη μνήμη διόρθωσης σφαλμάτων, δηλαδή τον αντίκτυπό της στην απόδοση του συστήματος. Το σημερινό τεστ θα απαντήσει σε αυτό το ερώτημα.

Πριν διαβάσετε αυτό το υλικό, σας συνιστούμε να εξοικειωθείτε με τα υλικά για και πλατφόρμα LGA1151.

Θεωρία

Πριν από τη δοκιμή, ας μιλήσουμε για σφάλματα μνήμης.
Τα σφάλματα που εμφανίζονται στη μνήμη μπορούν να χωριστούν σε δύο τύπους - υλικό και τυχαία. Ο λόγος για την εμφάνιση του πρώτου είναι τα ελαττωματικά τσιπ DRAM. Τα τελευταία προκύπτουν λόγω της επίδρασης ηλεκτρομαγνητικών παρεμβολών, ακτινοβολίας, άλφα και στοιχειωδών σωματιδίων κ.λπ. Κατά συνέπεια, τα σφάλματα υλικού μπορούν να διορθωθούν μόνο με την αντικατάσταση των τσιπ DRAM και τα τυχαία σφάλματα μπορούν να διορθωθούν χρησιμοποιώντας ειδικές τεχνολογίες, για παράδειγμα, ECC (Κώδικας Διόρθωσης Σφάλματος). Η διόρθωση σφαλμάτων ECC έχει δύο μεθόδους στο οπλοστάσιό της: SEC (Single Error Correction) και DED (Double Error Detection). Το πρώτο διορθώνει σφάλματα ενός bit σε μια λέξη 64 bit και το δεύτερο ανιχνεύει σφάλματα δύο bit.
Η εφαρμογή υλικού του ECC είναι να φιλοξενήσει πρόσθετα τσιπ μνήμης που χρειάζονται για την εγγραφή αθροισμάτων ελέγχου 8-bit. Έτσι, μια μονάδα μνήμης που διορθώνει σφάλματα με σχεδίαση μονής όψης θα έχει 9 τσιπ μνήμης αντί για 8 (όπως μια τυπική μονάδα) και με μια διπλής όψης - 18 αντί για 16. Ταυτόχρονα, το πλάτος του η μονάδα αυξάνεται από 64 σε 72 bit.
Κατά την ανάγνωση δεδομένων από τη μνήμη, το άθροισμα ελέγχου υπολογίζεται εκ νέου και συγκρίνεται με το αρχικό. Εάν το σφάλμα είναι σε ένα bit, διορθώνεται, αν σε δύο, ανιχνεύεται.

Πρακτική

Θεωρητικά, όλα είναι καλά - η μνήμη με διόρθωση σφαλμάτων αυξάνει την αξιοπιστία του συστήματος, κάτι που είναι πολύ σημαντικό κατά την κατασκευή διακομιστή ή σταθμού εργασίας. Στην πράξη όμως υπάρχει και η οικονομική πλευρά αυτού του ζητήματος. Εάν ο διακομιστής απαιτεί μνήμη διόρθωσης σφαλμάτων, τότε ο σταθμός εργασίας μπορεί να κάνει χωρίς ECC (πολλοί έτοιμοι σταθμοί εργασίας διαφορετικών κατασκευαστών είναι εξοπλισμένοι με συμβατική μνήμη RAM). Πόσο πιο ακριβή είναι η μνήμη με τη διόρθωση σφαλμάτων;
Μια τυπική μονάδα 8 GB DDR4-2133 κοστίζει περίπου 39 $, ενώ μια μονάδα ECC κοστίζει 48 $ (τη στιγμή που γράφονται αυτές οι γραμμές). Η διαφορά στο κόστος είναι περίπου 23%, κάτι που είναι αρκετά σημαντικό με την πρώτη ματιά. Αλλά αν κοιτάξετε το συνολικό κόστος του σταθμού εργασίας, τότε αυτή η διαφορά δεν θα υπερβαίνει το 5% αυτού. Έτσι, η αγορά μνήμης με ECC αυξάνει ελαφρώς μόνο το κόστος του σταθμού εργασίας. Το μόνο ερώτημα που παραμένει είναι πώς η μνήμη με ECC επηρεάζει την απόδοση του επεξεργαστή.
Για να απαντήσουν σε αυτήν την ερώτηση, οι συντάκτες του ιστότοπου πήραν για δοκιμή τις μονάδες μνήμης Samsung DDR4-2133 ECC και Kingston DDR4-2133 με τους ίδιους χρονισμούς 15-15-15-36 και 8 GB.

Στις μονάδες μνήμης Samsung M391A1G43DB0-CPB με διόρθωση σφαλμάτων, συγκολλούνται 9 μάρκες σε κάθε πλευρά.

Ενώ σε συμβατικές μονάδες μνήμης Kingston KVR21N15D8 / 8, συγκολλούνται 8 μάρκες σε κάθε πλευρά.

Δοκιμαστική βάση: Intel Xeon E3-1275v5, Supermicro X11SAE-F, Samsung DDR4-2133 ECC 8GB, Kingston DDR4-2133 non-ECC 8GB

Λεπτομέρεια

Επεξεργαστής: (HT on; TB off);
- Μητρική πλακέτα: ;
- RAM: 2x (M391A1G43DB0-CPB), 2x (KVR21N15D8/8);
- ΛΣ: .

Μεθοδολογία Δοκιμών

3DMark06 1.21;
- 7 zip 15.14;
- AIDA64 5,60;
- Cinebench R15;
- Fritz 4.2;
- Geekbench 3.4.1;
- Lux Mark v3.1;
- MaxxMEMI 1,99;
- Pass Mark v8;
- RealBench v2.43;
- SiSoftware Sandra 2016;
- SVPmark v3.0.3b;
- TrueCrypt 7.1a;
- WinRAR 5.30
- wPrime 2.10;
- x264 v5.0.1;
- x265 v0.1.4;
- Kraken;
- Οκτάνια
- Οκτάνια 2,0;
- Ειρηνευτής
- Sunspider
- Web XPRT.

mob_info