Μια μη παραμετρική γραμμική προσαρμογή:  Η 'ατελής μέθοδος του Theil'

Θεωρία

Όποτε χρησιμοποιούμε τη συνηθισμένη μέθοδο ελάχιστων τετραγώνων για προσαρμογή μιας εξίσωσης σε δεδομένα σημεία (x, y), υποθέτουμε ότι η κατανομή των (τυχαίων) σφαλμάτων των τιμών y είναι κανονική (κατανομή Gauss).

Ως μη-παραμετρικές ελεύθερες κατανομής) στατιστικές μέθοδοι ορίζονται γενικά εκείνες, στις οποίες δεν υπάρχουν παραδοχές ως προς τη μορφή των πληθυσμιακών κατανομών των χρησιμοποιούμενων δεδομένων.

Μια απλή, μη-παραμετρική μέθοδος προσαρμογής μιας ευθείας γραμμής σε μια ομάδα σημείων (x, y) είναι η αναφερόμενη ως 'Ατελής μέθοδος Theil', που ονομάζεται έτσι για να διακριθεί από μια αντίστοιχη, αλλά πολυπλοκότερη μέθοδο ('πλήρης μέθοδος') που αναπτύχθηκε από τον ίδιο.

Η ατελής μέθοδος υποθέτει ότι τα σημεία (x1, y1), (x2, y2) . . . (xN, yN) περιγράφονται από την εξίσωση

 y = a + bx

Ο υπολογισμός των a και b πραγματοποιείται ως εξής:

1ο βήμα: Όλα τα σημεία διατάσσονται κατά αυξανόμενη τιμή x.

2ο βήμα: Τα δεδομένα χωρίζονται σε δύο ομάδες με ίσο αριθμό (m) σημείων, τη χαμηλή ομάδα (L: low group) και την υψηλή ομάδα (Η: high group). Εάν ο αριθμός των σημείων (N) είναι περιττός, το μεσαίο σημείο δεν λαμβάνεται υπόψη και δεν υπάγεται σε καμία ομάδα.  Έτσι θα είναι N= 2m ή Ν = 2m+1).

3ο βήμα:  Η κλίση bi της ευθείας που συνδέει το i σημείο της ομάδας L με το i σημείο της ομάδας H iυπολογίζεται για όλα τα σημεία κάθε ομάδας, δηλαδή:

 

4ο βήμα:  Υπολογίζεται η διάμεση (median) τιμή των m τιμών b1, b2, . . .  bm και θεωρείται ότι αποτελεί την ζητούμενη κλίση (b) της ευθείας, δηλ. b = median(b1, b2, . . . bm).

5ο βήμα:  Για κάθε σημείο (xi,yi) υπολογίζεται η τιμής της τομής επί την αρχή ai χρησιμοποιώντας την b, δηλ.  

6ο βήμα:  Υπολογίζεται η διάμεση τιμή των N τιμών a1, a2, . . .  aN  και θεωρείται ότι αποτελεί την ζητούμενη τομή επί την αρχή των αξόνων (a), δηλ. a = median(a1, a2, . . . aN).

Η παραπάνω μέθοδος εκτίμησης των τιμών a και b έχει τα ακόλουθα πλεονεκτήματα σε σχέση με την ευρύτατα χρησιμοποιούμενη προσαρμογή ελάχιστων τετραγώνων:

(ι) Δεν προϋποθέτει ότι τα τυχαία σφάλματα βρίσκονται μόνο στις τιμές y.

(ιι) Δεν προϋποθέτει κανονική (gaussian) κατανομή των τυχαίων σφαλμάτων και στις τιμές x και στις τιμές y (δηλ. πρόκειται για μια τυπική μη-παραμετρική στατιστική μέθοδο).

(ιιι) Δεν επηρεάζεται από την παρουσία έκτροπων (outlying) πειραματικών σημείων, δηλ. είναι μια 'ανθεκτική (robust) μέθοδος'.

Το κύριο μειονέκτημά της μη-παραμετρικής μεθόδου είναι ο αλγοριθμικός χαρακτήρας της, δηλ. δεν υπάρχουν καθορισμένες εξισώσεις που επιτρέπουν τον άμεσο υπολογισμό των a και b, όπως στην περίπτωση της προσαρμογής ελάχιστων τετραγώνων [βλέπε το Applet: Πολυωνυμική προσέγγιση ελάχιστων τετραγώνων]. Αντίθετα, απαιτούνται καθορισμένα και μονότονα επαναλαμβανόμενα βήματα, γεγονός που καθιστά τους υπολογισμούς με το χέρι κουραστικούς (π.χ. χρειάζονται τρεις κατατάξεις κατά αύξουσα τιμή). Η προσφυγή σε πρόγραμμα υπολογιστή (π.χ. ένα λογιστικό φύλλο) είναι σχεδόν αναπόφευκτη, ιδιαίτερα όταν ο αριθμός των πειραματικών δεδομένων (x, y) είναι μεγάλος.

 

Applet

Με αυτό το applet επιδεικνύεται η μη-παραμετρική μέθοδος του Theil για την προσαρμογή της εξίσωσης y = a + bx σε σημεία (x, y) που ορίζει ο χρήστης και παρέχει μια οπτική σύγκριση με τα αντίστοιχα αποτελέσματα που προκύπτουν με την αντίστοιχη μέθοδο ελάχιστων τετραγώνων. Απλά, ο χρήστης με κλικ στο ποντίκι εισάγει Ν σημεία (4≤N≤200) (x, y) στην περιοχή εργασίας. Οι αντίστοιχες γραμμές (πράσινη για τη μη-παραμετρική προσαρμογή, κόκκινη για την προσαρμογή ελάχιστων τετραγώνων) εμφανίζονται μετά την εισαγωγή των πρώτων 4 σημείων.

Οι εκτιμώμενες τιμές κλίσης (b) και τομής επί την αρχή (a) εμφανίζονται στα αντίστοιχα (για κάθε μέθοδο) "παράθυρα".

 

Μπορεί κανείς να δοκιμάσει την ανθεκτικότητα (robustness) της μη-παραμετρικής προσαρμογής, εισάγοντας έκτροπα σημεία. Στο παραπάνω σχήμα δείχνεται τυπικό διάγραμμα, όπου ένα έκτροπο σημείο (outlying data point) υποχρεώνει την ευθεία ελάχιστων τετραγώνων (least squares method) να περάσει κάπως πιο κοντά από αυτό, ενώ η μη-παραμετρική μέθοδος (Theil's method) ουσιαστικά το αγνοεί.  

 

ΠΡΟΣΟΧΗ:  

Αν το applet δεν φαίνεται κάνετε κλικ εδώ.

Για μια πλήρη λίστα των applet κάνετε κλικ εδώ.

Υπεύθυνος σελίδας: Καθ. Κωνσταντίνος Η. Ευσταθίου