Για WR δεν έχω ξανακούσει ούτε και μπόρεσα να βρω κάτι googlάροντας για "WR statistics", "WR Visualization" ή στο Wikipedia.
Μήπως πρόκειται για κάποιο Windows distribution της R? Η περιγραφή (στατιστική, μαθηματική ανάλυση) είναι παρόμοια με την R.
Επιπλέον η R χρησιμοποιείται πολύ για number crunching στην παραγωγή, όχι μόνο για ακαδημαϊκές έρευνες. Παρέχεται ήδη ως
υπηρεσία από το Azure Machine Learningγια analytics, είναι ενσωματωμένη στην Oracle ως Enterprise R, και στον SQL Server 2016.
Το καλύτερο ίσως R distribution είναι αυτό της Revolution Analytics, καθώς ακόμα και η Community Editionχρησιμοποιεί και multicore
και τις SIMD εντολές της CPU για να επιταχύνει ακόμα και 7 φορές την επεξεργασία. Επίσης επιτρέπει την επεξεργασία περισσότερων
δεδομένων από αυτά που χωράνε στη μνήμη, κάτι που η κλασσική R δεν μπορεί να κάνει.
Η εταιρεία αγοράστηκε πρόσφατα από τη Microsoft και έχει ενσωματωθεί σε Azure και SQL Server.
Όσον αφορά την ίδια την ερώτηση:
Καταρχήν, η ερώτηση καλύπτει σχεδόν το 1/3 του τομέα του data engineering/data science. Υπάρχουν πολλά σενάρια, πολλά
εργαλεία και πολλοί τρόποι να κάνει κάποιος αυτό που θέλει. Το οποίο σημαίνει, πρέπει πρώτα να ξεκαθαρίσεις τί θέλεις να κάνεις.
Για τί είδους visualizations μιλάμε, πως θα χρησιμοποιηθούν και πως θα βγουν προς τα έξω (web ή image)? Χρειάζεται να είναι
interactive ή όχι? Άλλες δυνατότητες χρειάζονται για να φτιάξεις ένα Infographic και άλλες για να φτιάξεις ένα trellis plot.
To "μαύρο κώδικα" δεν τον γλυτώνεις αν θέλεις περίπλοκα πράγματα, ή interactivity. Αντιθέτως, αν θέλεις να παράγεις καθημερινά
κάποια τυπικά plots, μπορείς να γλυτώσεις αρκετό κώδικα. Για παράδειγμα, ένα trellis plot σε R μπορείς να το κάνεις με σχετικά λίγες
εντολές και να αλλάζεις μόνο τα δεδομένα.
Καταρχήν, στο ίδιο το Excel υπάρχει το Power BI το οποίο έχει *πολύ* δυνατά visualizations. Επίσης "παίζει" και στο Azure,
επιτρέποντας να επεξεργαστείς πολύ περισσότερα δεδομένα απ' ότι σε ένα μηχάνημα. Άσε που δεν χρειάζεται καν να μετακινήσεις
τα δεδομένα σου, αν η εταιρεία χρησιμοποιεί ήδη Azure. Τέλος, είναι *πολύ* ευκολότερο να μοιραστείς visualizations
με άλλους - απλά τα κάνεις publish στο Power BI του Azure.
Πρόσφατα βγήκε και το Power BI Desktop, οπότε μπορείς να το χρησιμοποιήσεις και ανεξάρτητα από το Excel. Αν ήθελες μία
σύντομη περιγραφή, το Power BI είναι κάτι σαν το Tableau.
Η R χρησιμοποιείται πάρα πολύ για ad-hoc number crunching, στατιστικά, visualizations αν και θα τη βρεις "περίεργη" ως γλώσσα.
Είναι όμως μία από τις βασικές γλώσσες του data engineering, έχει πολύ μεγάλο community, υπάρχουν πολλά διαθέσιμα courses όπως
το Data Science Specialization του Courser, βιβλία, άρθρα κλπ. Τον κώδικα πάντως δεν τον γλυτώνεις.
Άλλο ένα εργαλείο είναι και το Tableau, το οποίο είναι διαθέσιμο και ως ανεξάρτητο desktop προϊόν αλλά και ως server. Θα μπορούσες
να πεις ότι είναι αντίστοιχο του Power BI. Και με τα δύο μπορείς να φτιάξεις πολύ πιο ενδιαφέροντα visualizations, να τα κάνεις interactive,
αλλά μην περιμένεις να κάνεις όλα όσα περίεργα θα δεις να γίνονται με την R.
Τέλος, αν θέλεις να φτιάξεις ένα visualization το οποίο θα βάλεις σε κάποιο public web site (δηλ δεν μπορείς να πληρώνεις άδειες ανά χρήστη)
μπορείς να χρησιμοποιήσεις javascript και την d3.js ή άλλες παρόμοιες βιβλιοθήκες. Προφανώς απαιτείται περισσότερος κώδικας, οπότε
καλύτερο είναι να ετοιμάσεις το visualization αλλού και μετά να το μετατρέψεις σε d3.
Για όλα αυτά θα βρεις πολλά βιβλία, κυρίως στον O'Reilly αλλά και στο Manning. Ψάξε για data science, data visualizations κλπ.
Και μην ξεχάσεις να βάλεις τα εκπτωτικά κουπόνια που έχουμε αν αγοράσεις κανένα βιβλίο από εκεί
Παναγιώτης Καναβός, Freelancer
Twitter: http://www.twitter.com/pkanavos