Αλγόριθμοι εξομάλυνσης σημάτων

 

Θεωρία

Βελτίωση του λόγου σήματος-προς-θόρυβο (signal-to-noise ratio, SNR ή S/N) μπορεί να πραγματοποιηθεί με τεχνικές υλισμικού (hardware) ή λογισμικού (software). Η ευρύτατη χρήση προσωπικών υπολογιστών στη χημική οργανολογία και η ευελιξία προγραμματισμού που προσφέρουν καθιστούν ιδιαίτερα ελκυστικές τις μεθόδους λογισμικού για εξομάλυνση (ή φιλτράρισμα) σημάτων. Στη συνέχεια παρουσιάζονται μερικοί από τους πλέον χρησιμοποιούμενους αλγόριθμους εξομάλυνσης.

 

Κινούμενη μέση τιμή

Η απλούστερη τεχνική εξομάλυνσης σημάτων που αποτελούνται από ισοαπέχοντα σημεία είναι η κινούμενη μέση τιμή (moving average). Από μια αλληλουχία ακατέργαστων δεδομένων (raw data) [y1, y2, ..., yN] μπορεί να δημιουργηθεί μια αντίστοιχη αλληλουχία εξομαλυμένων δεδομένων (smoothed data) . Το εξομαλυμένο (smoothed) σημείο (yk)s αποτελεί τη μέση τιμή περιττού αριθμού 2n+1 (n=1, 2, 3, ..) διαδοχικών σημείων ακατέργαστων δεδομένων yk-n, y1k-n+1, ..., yk-1, yk, yk+1, ..., yk+n-1, y1k+n, δηλαδή θα είναι

 

Ο περιττός αριθμός 2n+1 συχνά ονομάζεται εύρος φίλτρου (filter width). Όσο μεγαλύτερο είναι το εύρος του φίλτρου, τόσο πιο έντονη είναι η εξομάλυνση. Η διαδικασία φαίνεται στο παρακάτω "ζωντανό" σχήμα:

Στο παράδειγμα αυτό το εύρος φίλτρου είναι 5. Υπολογίζεται η μέση τιμή των 5 πρώτων ακατέργαστων σημείων (μαύρα τετραγωνάκια) και η μέση τιμή τους (πράσινο τετραγωνάκι) αποτελεί το εξομαλυμένο σημείο με δείκτη 3. Το κόκκινο ορθογώνιο (κινούμενο "παράθυρο"), που περικλείει την εκάστοτε ομάδα 5 σημείων, κινείται μια θέση δεξιά και η μέση τιμή της νέας ομάδας σημείων αποτελεί το εξομαλυμένο σημείο με δείκτη 4 κ.ο.κ. Η διαδικασία αυτή ονομάζεται μη αντισταθμισμένη εξομάλυνση 5 σημείων (5-point unweighted smooth).

Ο SNR μπορεί να βελτιωθεί ακόμη περισσότερο με πολλαπλά περάσματα του φίλτρου (εξομάλυνση στα ήδη εξομαλυμένα σημεία) ή με αύξηση του εύρους φίλτρου. Είναι προφανές ότι με κάθε πέρασμα του φίλτρου χάνονται τα πρώτα n και τα τελευταία n σημεία.

Τα αποτελέσματα της τεχνικής αυτής είναι εντυπωσιακά και συγχρόνως παραπλανητικά, λόγω του υπερβολικού φιλτραρίσματος του θορύβου. Στην πραγματικότητα χάνεται ή αλλοιώνεται πληροφορία, επειδή δίνεται υπερβολικό στατιστικό βάρος σε σημεία αρκετά μακριά από το κεντρικό σημείο.

 

Αλγόριθμος Savitzky-Golay

Μια πολύ καλύτερη τακτική από το να λαμβάνεται απλά η μέση τιμή των σημείων είναι να πραγματοποιείται προσαρμογή ελαχίστων τετραγώνων σε μια μικρή ομάδα διαδοχικών σημείων και να αντικαθίσταται το κεντρικό σημείο της ομάδας από τη θεωρητική τιμή που παρέχεται από το προκύπτον πολυώνυμο.

Οι Savitzky και Golay (βλέπε A. Savitzky and M. J. E. Golay, Anal. Chem., 1964, 36, 1627) έδειξαν ότι μπορεί να υπολογισθεί μια ομάδα ακέραιων αριθμών (A-n, A-(n-1) ..., An-1, An) που μπορούν να χρησιμεύσουν ως συντελεστές στατιστικού βάρους κατά τη διαδικασία εξομάλυνσης. Η χρήση αυτών των συγκεκριμένων συντελεστών στατιστικού βάρους, που αναφέρονται και ως ακέραιοι συνέλιξης (convolution integers), αποδεικνύεται ότι παρέχει αποτελέσματα ισοδύναμα με εκείνα της προσαρμογής σε πολυώνυμο που προαναφέρθηκε. Η μέθοδος των  Savitzky-Golay  από υπολογιστική άποψη είναι πιο αποτελεσματική, απλούστερη και ταχύτατη σε σχέση με τις διαδοχικές πολυωνυμικές προσαρμογές κατά ομάδες σημείων. Επομένως, το εξομαλυμένο σημείο (yk)s με τον αλγόριθμο των Savitzky-Golay θα παρέχεται απλά από την ακόλουθη εξίσωση:

Μπορούν να χρησιμοποιηθούν αρκετές ομάδες ακεραίων συνέλιξης ανάλογα με το ζητούμενο εύρος φίλτρου ως και τον βαθμό του πολυωνύμου που προσαρμόζεται στα δεδομένα. Τυπικές ομάδες ακεραίων "δευτεροβάθμιας εξομάλυνσης" δίνονται στον επόμενο πίνακα:

 

 

Εύρος φίλτρου (2n+1)

i

11

9

7

5

-5

-36

 

 

 

-4

9

-21

 

 

-3

44

14

-2

 

-2

69

39

3

-3

-1

84

54

6

12

0

89

59

7

17

1

84

54

6

12

2

69

39

3

-3

3

44

14

-2

 

4

9

-21

 

 

5

-36

 

 

 

Με κατάλληλες ομάδες ακεραίων συνέλιξης, μπορούν να ληφθούν απ'ευθείας οι παράγωγοι 1ης, 2ης, ... κ.λπ τάξης του σήματος και έτσι, ο αλγόριθμος των Savitzky-Golay είναι κατάλληλος για τον απ'ευθείας υπολογισμό των παραγώγων θορυβωδών σημάτων συνιστώμενων από διακριτά και ισοαπέχοντα σημεία.

Η εξομάλυνση με τον αλγόριθμο των Savitzky-Golay δεν είναι τόσο έντονη, όσο και εκείνη της κινούμενης μέσης τιμής, αλλά και η απώλεια ή αλλοίωση της πληροφορίας είναι περιορισμένη. Θα πρέπει να τονισθεί ότι και οι δύο αλγόριθμοι είναι "απωλεστικοί", δηλαδή όχι μόνο δεν προσθέτουν επιπλέον πληροφορία, αλλά αντίθετα συμβάλλουν στην απώλεια πληροφορίας από το αρχικό σήμα. Θα μπορούσε κανείς να δεχθεί ότι περισσότερο χρησιμεύουν για να κάνουν το αρχικό σήμα πιο "εμφανίσιμο".

 

Σύνολα μέσων τιμών

Στη μέθοδο των συνόλων μέσων τιμών (ensemble average) συλλέγονται τα σήματα ως διαδοχικές ομάδες δεδομένων και αθροίζονται σημείο προς σημείο (δηλαδή το i-σημείο της μίας με το i-σημείο της άλλης κ.ο.κ.). Επομένως, προαπαιτούμενο για την εφαρμογή της  μεθόδου αυτής είναι η δυνατότητα πολλαπλής αναπαραγωγής του σήματος, αντίθετα με τις προηγούμενες μεθόδους που "λειτουργούν" σε μία και μόνη ομάδα δεδομένων.

Τυπική εφαρμογή των συνόλων μέσων τιμών πραγματοποιείται στις φασματοσκοπίες NMR και FT-IR, όπου το τελικό φάσμα ουσιαστικά είναι το μέσο φάσμα χιλιάδων επιμέρους φασμάτων. Αυτός είναι και ο μόνος τρόπος για να ληφθεί ένα τελικό σήμα, όταν στην περίπτωση μιας απλής μέτρησης (ή σάρωσης) το λαμβανόμενο σήμα είναι "πνιγμένο" σε τόσο θόρυβο, που ουσιαστικά εξαφανίζει την οποιαδήποτε χρήσιμη πληροφορία. Η δραστικότητα της μεθόδου οφείλεται βέβαια στη συνεχή ροή νέας πληροφορίας.

Επαναλαμβανόμενες προσθέσεις θορυβωδών σημάτων σημείο-προς-σημείο έχουν ως αποτέλεσμα να αναδεικνύονται τα συστηματικά χαρακτηριστικά τους, ενώ μειώνεται σταδιακά ο τυχαίος θόρυβος ο οποίος έχει μηδενική μέση τιμή. Εάν (SNR)o είναι ο αρχικός λόγος σήματος-προς-θόρυβο, ο τελικός λόγος (SNR)f μετά από N επαναλήψεις (ή σαρώσεις) παρέχεται από τη σχέση:

Έτσι, αν το μέσο σήμα αποτελεί αποτέλεσμα άθροισης σημείο-προς-σημείο 100 (ή 10.000) επιμέρους σημάτων, το επίπεδο θορύβου μειώνεται κατά 10 (ή 100) φορές.

 

Applet

Με αυτό το applet μπορεί να επιδειχθεί η αρχή λειτουργίας και των τριών αλγορίθμων εξομάλυνσης. Ο χρήστης έχει αρκετές επιλογές. Υπάρχουν τέσσερις διαφορετικές μορφές σημάτων (F1, F2, F3, F4) καθένα από τα οποία αποτελείται από 1000 σημεία. Μπορούν να επιλεγούν 3 επίπεδα θορύβου που θα προστεθεί στο αρχικό σήμα. Για τους αλγόριθμους της κινούμενης μέσης τιμής και των Savitzky-Golay μπορούν να επιλεγούν 3 εύρη φίλτρου (5, 7 και 9 σημείων).

Κατά την εφαρμογή κάθε αλγορίθμου εξομάλυνσης, το παραγόμενο σήμα εμφανίζεται με μαύρο χρώμα και ο χρήστης μπορεί να επιθέσει σε αυτό και το κανονικό (αθόρυβο) σήμα ως και το αρχικό θορυβώδες σχήμα με ανοικτό μπλε και ανοικτό κόκκινο χρώμα, αντίστοιχα, ώστε να μπορεί να γίνει σύγκριση.

Αξίζει να παρατηρηθεί η διαφορά μεταξύ των αλγορίθμων της κινούμενης μέσης τιμής και των Savitzky-Golay με το σήμα F3. Το σήμα αυτό αποτελείται από επτά ισοϋψείς κορυφές Gauss με προοδευτικά μειούμενο εύρος. Διαδοχικά φιλτραρίσματα (περάσματα) του φίλτρου κινούμενης μέσης τιμής έχουν ως αποτέλεσμα τη μείωση του ύψους κορυφής των πιο στενών κορυφών. Αντίθετα, ο αλγόριθμος των Savitzky-Golay "σέβεται" αυτή την κρίσιμη πληροφορία (ύψος κορυφής) και η αλλοίωση που προκαλεί είναι περιορισμένη.

Η μέθοδος των συνόλων μέσων τιμών επιδεικνύεται καλύτερα με το σήμα F2, με το οποίο προσομοιώνονται οι πολύ στενές κορυφές που συνήθως παρουσιάζονται στα φάσματα NMR. Εάν στο σήμα αυτό προστεθεί υψηλό επίπεδο θορύβου, μόλις και θα διακρίνονται οι υψηλότερες κορυφές. Στη συνέχεια, αυξάνοντας τον αριθμό των σαρώσεων (πολλαπλές προσθέσεις σημείο-προς-σημείο νέων σημάτων), το σήμα αρχίζει να αναδεικνύεται θεαματικά και να γίνονται ευδιάκριτες ακόμη και οι χαμηλότερες κορυφές.

 

ΠΡΟΣΟΧΗ:  

Αν το applet δεν φαίνεται κάνετε κλικ εδώ.

Για μια πλήρη λίστα των applet κάνετε κλικ εδώ.

Υπεύθυνος σελίδας: Καθ. Κωνσταντίνος Η. Ευσταθίου