EN / EL Ευρετήριο
Σχολή Διοίκησης Επιχειρήσεων Τμήμα Λογιστικής & Χρηματοοικονομικής
Αρχική/ Πρόγραμμα Σπουδών/ Υπολογιστικά Συστήματα για την Επιστήμη Δεδομένων
DAA001
Εξάμηνο 1 Mandatory Special background

Υπολογιστικά Συστήματα για την Επιστήμη Δεδομένων

6
Μονάδες ECTS
39
Συνολικές Ώρες Διδασκαλίας
English
Γλώσσα
None
Προαπαιτούμενα
No
Ανοιχτό σε Erasmus
Περιγραφή Μαθήματος

Το μάθημα παρέχει το υπολογιστικό πλαίσιο και τις αλγοριθμικές τεχνικές που απαιτούνται για την υλοποίηση λύσεων βασισμένων σε δεδομένα στους τομείς της λογιστικής, του ελέγχου και της χρηματοοικονομικής διοίκησης. Επικεντρώνεται στην εφαρμογή μεθόδων που μεταβαίνουν από θεωρητικά μοντέλα σε λειτουργικό και επεκτάσιμο κώδικα σε R και Python. Αρχικά, το μάθημα θεμελιώνει τις βάσεις της αλγοριθμικής λογικής και των δομών δεδομένων, διασφαλίζοντας ότι οι φοιτητές μπορούν να χειρίζονται αποδοτικά σύνθετα χρηματοοικονομικά σύνολα δεδομένων. Στη συνέχεια, προχωρά σε προηγμένες υπολογιστικές μεθόδους, καλύπτοντας την υλοποίηση αλγορίθμων βελτιστοποίησης για τη λήψη χρηματοοικονομικών αποφάσεων και την ανάπτυξη αρχιτεκτονικών μηχανικής μάθησης.

Μαθησιακά Αποτελέσματα

Μετά από επιτυχή ολοκλήρωση, οι φοιτητές θα είναι σε θέση να:

  1. Επίδειξη λειτουργικής κατανόησης της αλγοριθμικής λογικής, της ροής ελέγχου και των βασικών δομών δεδομένων, όπως εφαρμόζονται σε χρηματοοικονομικά και λογιστικά σύνολα δεδομένων.
  2. Συγγραφή καθαρού, αποδοτικού και επεκτάσιμου κώδικα σε R και Python για εισαγωγή, καθαρισμό, μετασχηματισμό και ανάλυση σύνθετων χρηματοοικονομικών συνόλων δεδομένων.
  3. Υλοποίηση αλγορίθμων βελτιστοποίησης για την υποστήριξη χρηματοοικονομικών αποφάσεων, όπως κατασκευή χαρτοφυλακίου, ελαχιστοποίηση κόστους και κατανομή πόρων.
  4. Κατασκευή, εκπαίδευση και αξιολόγηση μοντέλων μηχανικής μάθησης που σχετίζονται με εφαρμογές λογιστικής και χρηματοοικονομικής, συμπεριλαμβανομένων της ταξινόμησης, της παλινδρόμησης και της ανίχνευσης ανωμαλιών.
  5. Κριτική αξιολόγηση της καταλληλότητας και των περιορισμών εναλλακτικών υπολογιστικών προσεγγίσεων για ένα δεδομένο χρηματοοικονομικό ή ελεγκτικό πρόβλημα.
  6. Ανάπτυξη και εφαρμογή εργασιών υπολογιστικής επεξεργασίας δεδομένων μέσω Μεγάλων Γλωσσικών Μοντέλων (Large Language Models, LLMs).
Περίγραμμα Μαθήματος

10 θεματικές ενότητες ανά το εξάμηνο.

01

Θεμέλια Υπολογιστικής και Αλγοριθμικής Σκέψης: Μεταβλητές, τύποι δεδομένων, ροή ελέγχου (βρόχοι, συνθήκες), συναρτήσεις και δομημένος προγραμματισμός, εισαγωγή στα περιβάλλοντα R και Python, συγγραφή και αποσφαλμάτωση βασικών σεναρίων.

02

Δομές Δεδομένων και Διαχείριση Χρηματοοικονομικών Δεδομένων: Πίνακες (arrays), λίστες, λεξικά και dataframes, εισαγωγή και καθαρισμός χρηματοοικονομικών συνόλων δεδομένων, συνένωση και αναμόρφωση δεδομένων, διαχείριση ελλειπουσών τιμών και ακραίων παρατηρήσεων, εφαρμογή σε μελέτες περίπτωσης με R και Python.

03

Αριθμητικές Μέθοδοι και Βελτιστοποίηση Ι: Μαθηματικά θεμέλια της βελτιστοποίησης, βελτιστοποίηση χωρίς περιορισμούς, μέθοδος καθόδου κλίσης (gradient descent) και οι παραλλαγές της, κριτήρια σύγκλισης, υλοποίηση σε Python.

04

Αριθμητικές Μέθοδοι και Βελτιστοποίηση ΙΙ: Βελτιστοποίηση με περιορισμούς, γραμμικός και τετραγωνικός προγραμματισμός, εφαρμογές στη βελτιστοποίηση χαρτοφυλακίου και στην κατανομή πόρων, ερμηνεία και εφαρμογή σε μελέτες περίπτωσης με Python.

05

Μηχανική Μάθηση Ι – Επιβλεπόμενη Μάθηση: Πλαίσια παλινδρόμησης και ταξινόμησης, διαχωρισμός συνόλου εκπαίδευσης/ελέγχου και διασταυρούμενη επικύρωση, δέντρα απόφασης και τυχαία δάση, μετρικές αξιολόγησης μοντέλων, εφαρμογή σε χρηματοοικονομικά σύνολα δεδομένων με Python.

06

Μηχανική Μάθηση ΙΙ – Προχωρημένη Επιβλεπόμενη Μάθηση: Μέθοδοι συνόλου (bagging, boosting, gradient boosting), τεχνικές κανονικοποίησης (lasso και ridge), ρύθμιση υπερπαραμέτρων, ερμηνεία και εφαρμογή σε μελέτες περίπτωσης με Python.

07

Μηχανική Μάθηση ΙΙΙ – Μη Επιβλεπόμενη Μάθηση: Αλγόριθμοι ομαδοποίησης (k-means, ιεραρχική), μείωση διαστατικότητας (PCA), ανίχνευση ανωμαλιών για απάτη και χρηματοοικονομική δυσπραγία, Μεγάλα Γλωσσικά Μοντέλα στην Υπολογιστική για την Επιστήμη των Δεδομένων: επεξεργασία μη δομημένων δεδομένων, Retrieval Augmented Generation (RAG), διακομιστές Model Context Protocol (MCP), Agentic AI και μηχανισμοί επικύρωσης, εφαρμογή σε μελέτες περίπτωσης με Python.

08

Επεξεργασία Φυσικής Γλώσσας για τη Χρηματοοικονομική: Προεπεξεργασία κειμένου και εξαγωγή χαρακτηριστικών, αναπαραστάσεις bag-of-words και TF-IDF, ανάλυση συναισθήματος σε χρηματοοικονομικά κείμενα, εισαγωγή σε μοντέλα βασισμένα σε transformers (FinBERT), εφαρμογή σε τηλεδιασκέψεις αποτελεσμάτων (earnings calls) και ετήσιες εκθέσεις.

09

Επεκτάσιμες Ροές Δεδομένων και Αυτοματοποίηση Ροών Εργασίας: Συγγραφή αναπαραγώγιμων και δομημένων ροών (pipelines), εισαγωγή στον έλεγχο εκδόσεων (Git), μαζική επεξεργασία μεγάλων χρηματοοικονομικών συνόλων δεδομένων, χρονοπρογραμματισμός και αυτοματοποίηση, εφαρμογή σε μελέτες περίπτωσης με R και Python.

10

Ανάπτυξη και Επικοινωνία Λύσεων Επιστήμης Δεδομένων: Βασικές αρχές σειριοποίησης (serialization) και ανάπτυξης μοντέλων, δημιουργία αναπαραγώγιμων ερευνητικών αναφορών (R Markdown, Jupyter), επικοινωνία αναλυτικών αποτελεσμάτων σε μη τεχνικό κοινό, επαγγελματικοί και δεοντολογικοί προβληματισμοί στην επιστήμη χρηματοοικονομικών δεδομένων.

Αξιολόγηση

Περιγραφή της διαδικασίας αξιολόγησης

Γλώσσα Αξιολόγησης, Μέθοδοι Αξιολόγησης, Διαμορφωτική ή Συμπερασματική, Δοκιμασία Πολλαπλής Επιλογής, Ερωτήσεις Σύντομης Απάντησης, Ερωτήσεις Ανάπτυξης Δοκιμίου, Επίλυση Προβλημάτων, Γραπτή Εργασία, Έκθεση/Αναφορά, Προφορική Εξέταση, Δημόσια Παρουσίαση, Εργαστηριακή Εργασία, Κλινική Εξέταση Ασθενούς, Καλλιτεχνική Ερμηνεία, Άλλη/Λοιπή

Αναφέρονται ρητά καθορισμένα κριτήρια αξιολόγησης και εάν και πού είναι προσβάσιμα από τους φοιτητές.

Η γλώσσα αξιολόγησης του μαθήματος είναι η αγγλική και οι φοιτητές αναμένεται να επιδεικνύουν το απαιτούμενο επίπεδο επάρκειας.

Η αξιολόγηση του μαθήματος περιλαμβάνει:

Ενδιάμεση Εξέταση (40%, επίλυση προβλημάτων)

Τελική Εξέταση (60%, επίλυση προβλημάτων)

Τα κριτήρια αξιολόγησης σε όλες τις μεθόδους εξέτασης περιλαμβάνουν τα ακόλουθα:

Επίδειξη βασικών γνώσεων που σχετίζονται με το περιεχόμενο του μαθήματος

Επίδειξη ικανότητας εφαρμογής των γνώσεων σε δεδομένο πρόβλημα ή μελέτη περίπτωσης

Κριτική ικανότητα που αποδεικνύεται στην εφαρμογή κατάλληλων μεθόδων/γνώσεων σε δεδομένη περίπτωση ή/και στην ανάπτυξη επιχειρημάτων βασισμένων στη θεωρία και τη βιβλιογραφία.

Δομή και παρουσίαση

Χρήση της αγγλικής γλώσσας

Αναλυτικότερα κριτήρια αξιολόγησης θα σας παρέχονται στο έγγραφο εγχειριδίου του μαθήματος ή θα αναρτώνται στην ιστοσελίδα του μαθήματος, εφόσον κρίνεται απαραίτητο.

Προτεινόμενη Βιβλιογραφία
  1. Bird, S., Klein, E. and Loper, E. (2009) Natural Language Processing with Python. O'Reilly Media.
  2. Gardener, M. (2012). Beginning R: the statistical programming language. John Wiley & Sons.
  3. Jones, E., Harden, S., & Crawley, M. J. (2022). The R book. John Wiley & Sons.
  4. Jurafsky, D. and Martin, J.H. (2009) Speech and Language Processing. 2nd edn. Pearson Prentice Hall. (3rd edition draft available at web.stanford.edu/~jurafsky/slp3/)
  5. Raschka, S. and Mirjalili, V. (2019) Python Machine Learning. 3rd edn. Packt Publishing.
  6. Vasiliev, Y. (2020). Natural language processing with Python and spaCy: A practical introduction. No Starch Press.
  7. Λοιπές πηγές βιβλιοθήκης, συμπεριλαμβανομένων άρθρων επιστημονικών περιοδικών προσβάσιμων μέσω της Βιβλιοθήκης, όπως υποδεικνύονται από τον διδάσκοντα.