1 00:00:00,000 --> 00:00:11,370 2 00:00:11,370 --> 00:00:12,370 JEFFREY LICHT: Γεια σου εκεί. 3 00:00:12,370 --> 00:00:13,550 Είμαι Jeffrey Licht. 4 00:00:13,550 --> 00:00:17,890 Και είμαι εδώ για να σας μιλήσω για το Βιβλιοθήκη του Χάρβαρντ και την οικοδόμηση του αύριο 5 00:00:17,890 --> 00:00:20,870 σήμερα βιβλιοθήκη, υποθέτω. 6 00:00:20,870 --> 00:00:23,040 Έτσι, το υπόβαθρο εδώ, το γήπεδο για αυτήν την περίοδο 7 00:00:23,040 --> 00:00:26,930 είναι ουσιαστικά ότι υπάρχει πολλά βιβλιογραφικά δεδομένα 8 00:00:26,930 --> 00:00:28,400 διαθέσιμο στις βιβλιοθήκες του Χάρβαρντ. 9 00:00:28,400 --> 00:00:33,434 Και υπάρχει μια ευκαιρία, μέσα από μερικά από τα εργαλεία 10 00:00:33,434 --> 00:00:36,350 και ένα έργο που είναι υπό ανάπτυξη, για να αποκτήσετε πρόσβαση στις πληροφορίες 11 00:00:36,350 --> 00:00:42,430 και να το πάρετε σε μέρη που η Χάρβαρντ Βιβλιοθήκη δεν κάνει τώρα, 12 00:00:42,430 --> 00:00:45,460 κάνει νέα πράγματα με αυτό, το πείραμα και να παίζουν με αυτό. 13 00:00:45,460 --> 00:00:52,413 >> Έτσι, το σημείο εισόδου σε αυτό είναι ένα API ονομάζεται η Βιβλιοθήκη του Χάρβαρντ Cloud, η οποία 14 00:00:52,413 --> 00:00:57,650 είναι μια ανοικτή διακομιστής μεταδεδομένων, το οποίο θα μιλήσω τώρα. 15 00:00:57,650 --> 00:01:02,595 Έτσι ώστε το υπόβαθρο είναι ότι υπάρχει μια πολλά πράγματα στη βιβλιοθήκη του Χάρβαρντ. 16 00:01:02,595 --> 00:01:07,150 Έχουμε πάνω από 13 εκατομμύρια βιβλιογραφικές τα αρχεία, τα εκατομμύρια των εικόνων, 17 00:01:07,150 --> 00:01:11,090 και χιλιάδες εύρεση του AIDS, η οποία είναι ουσιαστικά έγγραφα που περιγράφουν 18 00:01:11,090 --> 00:01:15,500 συλλογές, λέει ό, τι είναι σε αυτούς, κουτιά χαρτιά 19 00:01:15,500 --> 00:01:21,080 και ούτω καθεξής, που αντιπροσωπεύουν πάνω από το ένα εκατομμύριο μεμονωμένα έγγραφα. 20 00:01:21,080 --> 00:01:24,290 Και υπάρχει επίσης ένα πολύ πληροφορίες ότι η βιβλιοθήκη έχει 21 00:01:24,290 --> 00:01:28,180 για το πώς το περιεχόμενο χρησιμοποιείται ότι θα μπορούσε να είναι ενδιαφέρον για τους ανθρώπους 22 00:01:28,180 --> 00:01:32,400 που μπορεί να θέλουν να συνεργαστούν μαζί της. 23 00:01:32,400 --> 00:01:36,150 >> Έτσι, όλες οι πληροφορίες η βιβλιοθήκη έχει μεταδεδομένων. 24 00:01:36,150 --> 00:01:39,500 Έτσι, τα μεταδεδομένα είναι δεδομένα για τα δεδομένα. 25 00:01:39,500 --> 00:01:42,070 Έτσι, όταν μιλάμε για οι πληροφορίες που είναι 26 00:01:42,070 --> 00:01:44,890 διαθέσιμα μέσω της βιβλιοθήκης σύννεφο που είναι διαθέσιμα, 27 00:01:44,890 --> 00:01:47,760 δεν είναι κατ 'ανάγκην τα πραγματικά έγγραφα 28 00:01:47,760 --> 00:01:53,060 μόνες τους, όχι κατ 'ανάγκη την πλήρη κείμενο των βιβλίων ή τις πλήρεις εικόνες, 29 00:01:53,060 --> 00:01:54,890 όμως ότι στην πραγματικότητα μπορεί να είναι η περίπτωση. 30 00:01:54,890 --> 00:01:57,550 Αλλά είναι πραγματικά πληροφορίες σχετικά με τα δεδομένα. 31 00:01:57,550 --> 00:02:00,909 >> Έτσι, μπορείτε να σκεφτείτε καταλογογράφηση πληροφορίες, οι αριθμοί κλήσης, θέματα, 32 00:02:00,909 --> 00:02:02,700 πόσα αντίγραφα της το βιβλίο είναι εκεί, τι 33 00:02:02,700 --> 00:02:06,380 είναι οι εκδόσεις, ποια είναι η μορφές, οι συγγραφείς, και ούτω καθεξής. 34 00:02:06,380 --> 00:02:12,250 Έτσι, υπάρχει ένα πλήθος πληροφοριών σχετικά με οι πληροφορίες στην συλλογή που, 35 00:02:12,250 --> 00:02:14,400 από μόνη της, είναι το είδος του εγγενώς χρήσιμη. 36 00:02:14,400 --> 00:02:19,230 Και όμως, αν είστε να κάνει τη σε βάθος έρευνα, 37 00:02:19,230 --> 00:02:25,160 που προφανώς θέλετε να πάρετε την πραγματική το ίδιο περιεχόμενο και να εξετάσουμε τα δεδομένα, 38 00:02:25,160 --> 00:02:30,140 Τα μεταδεδομένα είναι χρήσιμη από την άποψη της τόσο την ανάλυση της σώμα ως σύνολο, 39 00:02:30,140 --> 00:02:33,870 σαν αυτό που τα πράγματα βρίσκονται στη συλλογή. 40 00:02:33,870 --> 00:02:35,520 Πώς σχετίζονται; 41 00:02:35,520 --> 00:02:39,482 Αυτό σας βοηθά να βρείτε πραγματικά άλλα πράγματα, το οποίο είναι πραγματικά ο κύριος σκοπός της. 42 00:02:39,482 --> 00:02:41,190 Το σημείο της μεταδεδομένων και ο κατάλογος 43 00:02:41,190 --> 00:02:43,230 είναι να σας βοηθήσει να βρείτε όλα οι πληροφορίες που είναι 44 00:02:43,230 --> 00:02:46,590 διαθέσιμες εντός των συλλογών. 45 00:02:46,590 --> 00:02:53,690 >> Έτσι, αυτό είναι ένα παράδειγμα των μεταδεδομένων για ένα βιβλίο στη βιβλιοθήκη του Χάρβαρντ. 46 00:02:53,690 --> 00:02:56,370 Γι 'αυτό είναι εκεί. 47 00:02:56,370 --> 00:02:59,850 Και μπορείτε να δείτε ότι είναι πραγματικά μέτρια πολύπλοκη. 48 00:02:59,850 --> 00:03:04,610 Και μέρος της αξίας των μεταδεδομένων στο πλαίσιο του συστήματος του Χάρβαρντ Βιβλιοθήκη 49 00:03:04,610 --> 00:03:09,320 είναι ότι αυτό είναι το είδος του δημιουργήθηκε από καταλογογράφοι 50 00:03:09,320 --> 00:03:12,720 και συναρμολογούνται από τους ανθρώπους που εφαρμόζονται πολλή εμπειρογνωμοσύνη και την ικανότητα 51 00:03:12,720 --> 00:03:20,030 και σκέφτηκα να την πάροδο του χρόνου, το οποίο έχει μεγάλη αξία. 52 00:03:20,030 --> 00:03:25,450 >> Έτσι, αν ρίξετε μια ματιά σε αυτό το αρχείο για Η σχολιασμένη Alice, μπορείτε να μάθετε 53 00:03:25,450 --> 00:03:32,590 έχετε τον τίτλο, ο οποίος το έγραψε, το συγγραφέας, και όλα τα διαφορετικά θέματα 54 00:03:32,590 --> 00:03:35,380 τις οποίες οι πολίτες έχουν καταγραφεί σε. 55 00:03:35,380 --> 00:03:40,110 Και μπορείτε να δείτε εκεί επίσης, σε Εκτός από τις πολλές καλές πληροφορίες 56 00:03:40,110 --> 00:03:42,852 Εδώ, υπάρχει κάποια επικάλυψη. 57 00:03:42,852 --> 00:03:45,560 Υπάρχει μια μεγάλη πολυπλοκότητα που είναι αντικατοπτρίζεται μέσα από τα μεταδεδομένα 58 00:03:45,560 --> 00:03:46,300 ότι έχετε. 59 00:03:46,300 --> 00:03:50,320 >> Έτσι, ένας τίτλος αυτού του βιβλίου είναι Περιπέτειες της Αλίκης στη Χώρα των Θαυμάτων. 60 00:03:50,320 --> 00:03:53,880 Έτσι, αυτό είναι ένα σχολιασμένο έκδοση του ίδιου βιβλίου. 61 00:03:53,880 --> 00:03:56,380 Αλλά είναι επίσης ονομάζεται τη σχολιασμένη Αλίκη, Αλίκη 62 00:03:56,380 --> 00:03:58,570 στη χώρα των θαυμάτων, διότι είναι κάτι το οποίο 63 00:03:58,570 --> 00:04:00,430 Martin Gardner έγραψε και σχολιασμένη το βιβλίο. 64 00:04:00,430 --> 00:04:03,369 Και υπάρχουν πολλές μεγάλες πληροφορίες σχετικά με τη λογική παζλ και τα πράγματα 65 00:04:03,369 --> 00:04:05,410 μέσα Alice ότι μάλλον δεν γνωρίζουν. 66 00:04:05,410 --> 00:04:07,000 Έτσι πρέπει να πάτε να το διαβάσετε. 67 00:04:07,000 --> 00:04:11,940 >> Αλλά μπορείτε να δείτε εκεί πολλή λεπτομέρεια εδώ, 68 00:04:11,940 --> 00:04:15,340 συμπεριλαμβανομένων των αναγνωριστικών, όταν δημιουργήθηκε, από πού προήλθε, 69 00:04:15,340 --> 00:04:17,420 από την άποψη του Χάρβαρντ σύστημα, και ούτω καθεξής. 70 00:04:17,420 --> 00:04:20,350 Έτσι, αυτό είναι ένα δείγμα το είδος των μεταδεδομένων 71 00:04:20,350 --> 00:04:24,340 ότι μπορείτε να δείτε για ένα βιβλίο στο Η συλλογή της Βιβλιοθήκης του Χάρβαρντ. 72 00:04:24,340 --> 00:04:26,680 >> Αυτό είναι κάτι εντελώς διαφορετικό. 73 00:04:26,680 --> 00:04:32,610 Έτσι, υπάρχει ένα σύστημα που ονομάζεται VIA Χάρβαρντ, η οποία βασικά 74 00:04:32,610 --> 00:04:39,990 καταλογογραφεί εικόνες και αντικείμενα τέχνης και οπτική πράγματα σε όλη την Χάρβαρντ, 75 00:04:39,990 --> 00:04:44,010 και προσθέτοντας κάποια μεταδεδομένα σε αυτούς, τους ταξινόμηση, 76 00:04:44,010 --> 00:04:49,200 και, σε ορισμένες περιπτώσεις, παρέχοντας μικρές μικρογραφίες 77 00:04:49,200 --> 00:04:51,250 ότι μπορείτε να πάρετε μια εξετάσουμε αν το επιθυμείτε. 78 00:04:51,250 --> 00:04:54,240 >> Έτσι, αυτό είναι ένα παράδειγμα του μεταδεδομένα που έχετε για ένα πιάτο 79 00:04:54,240 --> 00:04:57,840 από, κατά πάσα πιθανότητα, η Αλίκη στη Χώρα των Θαυμάτων. 80 00:04:57,840 --> 00:05:00,499 Και μπορείτε να δείτε εκεί λιγότερα μεταδεδομένα εδώ. 81 00:05:00,499 --> 00:05:02,040 Είναι απλά ένα διαφορετικό είδος του αντικειμένου. 82 00:05:02,040 --> 00:05:03,425 Και έτσι υπάρχει λιγότερη πληροφορία. 83 00:05:03,425 --> 00:05:07,790 >> Μπορείτε ως επί το πλείστον έχουν το γεγονός ότι, μια κλήση αριθμός, κατ 'ουσίαν, ποιος το δημιούργησε, - 84 00:05:07,790 --> 00:05:10,410 >> Δεν ξέρουμε πότε δημιουργήθηκε. 85 00:05:10,410 --> 00:05:13,320 >> --and έναν τίτλο. 86 00:05:13,320 --> 00:05:14,300 >> Ένα άλλο παράδειγμα. 87 00:05:14,300 --> 00:05:16,380 Αυτό είναι ένα εργαλείο έρευνας. 88 00:05:16,380 --> 00:05:19,030 Έτσι, υπάρχει μια συλλογή από Lewis Χαρτιά Carroll στο Χάρβαρντ. 89 00:05:19,030 --> 00:05:23,601 Έτσι, αυτό περιγράφει τι είναι σε αυτή τη συλλογή. 90 00:05:23,601 --> 00:05:26,100 Έτσι, κάποιος έχει περάσει και κοίταξε μέσα από όλα τα πεδία 91 00:05:26,100 --> 00:05:32,220 και καταλογογράφησης, δεδομένου κάποιο υπόβαθρο, γράψει μια περίληψη του τι είναι εδώ. 92 00:05:32,220 --> 00:05:35,290 Και αν ήταν να εξετάσουμε περαιτέρω σε αυτό, αυτό 93 00:05:35,290 --> 00:05:39,620 συνεχίζεται για σελίδες και σελίδες και σελίδες, αλλά θα σας πω 94 00:05:39,620 --> 00:05:41,860 τι γράμματα και ό, τι ημερομηνίες Από ό, τι κουτιά 95 00:05:41,860 --> 00:05:44,289 υπήρχε καθ 'όλη τη συλλογή. 96 00:05:44,289 --> 00:05:46,330 Αλλά αυτό είναι κάτι ότι, αν είστε στο Χάρβαρντ, 97 00:05:46,330 --> 00:05:50,720 μπορείτε να πάτε και να το δούμε φυσικά και, πιθανώς, ρίξτε μια ματιά στο. 98 00:05:50,720 --> 00:05:53,440 >> Έτσι, όλα αυτά είναι μεγάλη. 99 00:05:53,440 --> 00:05:54,450 Αυτά τα μεταδεδομένα είναι χρήσιμο. 100 00:05:54,450 --> 00:05:56,327 Είναι το σύστημα Harvard Βιβλιοθήκη. 101 00:05:56,327 --> 00:05:58,910 Υπάρχουν εργαλεία σε απευθείας σύνδεση, όπου μπορείτε μπορεί να πάει και να ρίξετε μια ματιά σε αυτό, 102 00:05:58,910 --> 00:05:59,993 και να το δείτε, και ψάξε. 103 00:05:59,993 --> 00:06:02,810 Και μπορείτε να το και ζάρια φέτα αυτό με πολλούς διαφορετικούς τρόπους. 104 00:06:02,810 --> 00:06:06,920 >> Αλλά είναι πραγματικά διαθέσιμη μόνο αν είστε ένας άνθρωπος που κάθεται κάτω 105 00:06:06,920 --> 00:06:12,600 στο φυλλομετρητή σας ή κάτι ή το τηλέφωνό σας και την πλοήγηση μέσα από αυτό. 106 00:06:12,600 --> 00:06:16,730 Δεν είναι πραγματικά διαθέσιμες σε κάθε είδους που μπορούν να χρησιμοποιηθούν μόδας 107 00:06:16,730 --> 00:06:19,520 για άλλα συστήματα ή σε άλλους υπολογιστές να χρησιμοποιούν, 108 00:06:19,520 --> 00:06:21,500 όχι με τα συστήματα εντός η Βιβλιοθήκη του Χάρβαρντ, 109 00:06:21,500 --> 00:06:24,890 αλλά συστημάτων στον έξω κόσμο, μόνο τους άλλους γενικότερα. 110 00:06:24,890 --> 00:06:30,210 Το ερώτημα λοιπόν είναι, πώς μπορούμε εμείς θέτει στη διάθεση των υπολογιστών 111 00:06:30,210 --> 00:06:33,560 έτσι ώστε να μπορούμε να κάνουμε πιο ενδιαφέρουσα πράγματα με αυτό από μόνο 112 00:06:33,560 --> 00:06:36,550 περιήγηση μόνοι μας; 113 00:06:36,550 --> 00:06:39,766 >> Επομένως, γιατί θα θέλετε να το κάνετε αυτό; 114 00:06:39,766 --> 00:06:41,140 Υπάρχουν πολλές δυνατότητες. 115 00:06:41,140 --> 00:06:43,980 Ένα είναι θα μπορούσατε να οικοδομήσουμε μια εντελώς διαφορετικός τρόπος περιήγησης 116 00:06:43,980 --> 00:06:46,962 το περιεχόμενο που είναι διαθέσιμο μέσω των Βιβλιοθηκών του Χάρβαρντ. 117 00:06:46,962 --> 00:06:48,670 Θα σας δείξω ένα που αργότερα ονομάστηκε Stacklife, 118 00:06:48,670 --> 00:06:52,440 το οποίο έχει μία εντελώς διαφορετική αναλάβει αναζητούν περιεχόμενο. 119 00:06:52,440 --> 00:06:54,560 >> Θα μπορούσατε να οικοδομήσουμε μια μηχανή σύσταση. 120 00:06:54,560 --> 00:06:57,955 Έτσι Χάρβαρντ Βιβλιοθήκη δεν είναι η των επιχειρήσεων του λέγοντας, σας αρέσει αυτό το βιβλίο. 121 00:06:57,955 --> 00:07:01,080 Στη συνέχεια, πηγαίνετε να ρίξετε μια ματιά σε αυτά τα 17 άλλα βιβλία που μπορεί να σας ενδιαφέρει σε 122 00:07:01,080 --> 00:07:03,200 ή αυτοί οι 18 άλλες εικόνες. 123 00:07:03,200 --> 00:07:06,040 Αλλά αυτό σίγουρα θα μπορούσε να είναι ένα πολύτιμο χαρακτηριστικό. 124 00:07:06,040 --> 00:07:09,272 Και με δεδομένο το μεταδεδομένα, μπορεί είναι δυνατόν να θέσει ότι μαζί. 125 00:07:09,272 --> 00:07:11,980 Μπορεί να έχουν διαφορετικές ανάγκες σε όσον αφορά την αναζήτηση του περιεχομένου, 126 00:07:11,980 --> 00:07:16,200 όπως ίσως παρά τα εργαλεία που Διατίθενται ότι η βιβλιοθήκη κάνει 127 00:07:16,200 --> 00:07:18,450 διαθέσιμα, μπορεί να θέλετε να αναζητήσετε με διαφορετικό τρόπο 128 00:07:18,450 --> 00:07:21,847 ή βελτιστοποίηση για μια συγκεκριμένη υπόθεση χρήση, το οποίο ίσως είναι πολύ εξειδικευμένα. 129 00:07:21,847 --> 00:07:23,930 Ίσως υπάρχουν μόνο μερικά άνθρωποι στον κόσμο που 130 00:07:23,930 --> 00:07:25,846 θέλετε να αναζητήσετε το περιεχόμενο με αυτόν τον τρόπο, αλλά 131 00:07:25,846 --> 00:07:28,985 Θα ήταν υπέροχο αν μπορούσαμε θα μπορούσε να τους αφήσουμε να το κάνουν αυτό. 132 00:07:28,985 --> 00:07:30,860 Υπάρχει πολλή των analytics για το πόσο οι άνθρωποι 133 00:07:30,860 --> 00:07:33,860 χρησιμοποιήστε το περιεχόμενο που θα είναι πραγματικά ενδιαφέρον να γνωρίζουμε, να μάθετε 134 00:07:33,860 --> 00:07:37,280 ποια βιβλία χρησιμοποιούνται, τι δεν είναι, και ούτω καθεξής. 135 00:07:37,280 --> 00:07:41,670 Και έπειτα υπάρχει πολλή ευκαιρία να ενσωματώσουν 136 00:07:41,670 --> 00:07:45,210 με άλλες πληροφορίες ότι είναι εκεί έξω στο διαδίκτυο. 137 00:07:45,210 --> 00:07:46,880 Γι 'αυτό και have-- 138 00:07:46,880 --> 00:07:50,260 >> Για παράδειγμα, έχει NPR ένα τμήμα επανεξέταση του βιβλίου, 139 00:07:50,260 --> 00:07:53,090 όπου συνέντευξη συγγραφείς για τα βιβλία. 140 00:07:53,090 --> 00:07:56,837 Και γι 'αυτό θα ήταν μεγάλη, αν ήταν κοιτάζοντας ένα βιβλίο στο Χάρβαρντ 141 00:07:56,837 --> 00:07:59,670 Βιβλιοθήκη, και λέτε, εντάξει, δεν υπάρχει ήταν μια συνέντευξη με τον συγγραφέα. 142 00:07:59,670 --> 00:08:00,878 Ας πάει να ρίξει μια ματιά σε αυτό. 143 00:08:00,878 --> 00:08:05,461 Ή υπάρχει μια σελίδα της Wikipedia, ως ένα έγκυρη, επιστημονική αναφορά 144 00:08:05,461 --> 00:08:07,710 σχετικά με αυτό το βιβλίο που σας Ίσως θέλετε να ρίξετε μια ματιά. 145 00:08:07,710 --> 00:08:12,600 >> Υπάρχουν αυτά τα είδη των πηγών διάσπαρτα σε όλο το διαδίκτυο. 146 00:08:12,600 --> 00:08:16,555 Και τους φέρνοντας μαζί θα μπορούσε να είναι μια μεγάλη χρήση 147 00:08:16,555 --> 00:08:18,930 σε κάποιον κοιτάζοντας το περιεχόμενο, ψάχνει για κάτι. 148 00:08:18,930 --> 00:08:20,180 Αλλά δεν είναι, επίσης, η είδος των πράγμα που θα 149 00:08:20,180 --> 00:08:23,205 θέλουν η βιβλιοθήκη να είναι υπεύθυνος για να πάει προς τα κάτω και το κυνήγι κάτω 150 00:08:23,205 --> 00:08:25,455 Όλες αυτές οι διαφορετικές πηγές και τους συνδέοντας μαζί 151 00:08:25,455 --> 00:08:28,920 επειδή Αλλάζουμε συνεχώς. 152 00:08:28,920 --> 00:08:33,570 Και τι νομίζετε ότι είναι σημαντικό Μαΐου Δεν είναι αυτό που νομίζετε ότι είναι σημαντικό. 153 00:08:33,570 --> 00:08:36,929 >> Και ακόμα περισσότερο, ουσιαστικά υπάρχει μια πολλά πράγματα που δεν έχουμε σκεφτεί ακόμα. 154 00:08:36,929 --> 00:08:42,222 Έτσι, αν μπορούμε να ανοίξουμε αυτό επάνω, περισσότερο οι άνθρωποι εκτός από μισή ντουζίνα ή έτσι, 155 00:08:42,222 --> 00:08:45,174 που ψάχνουν σε αυτό για μια τακτική βάση μπορεί να σκεφτεί ιδέες 156 00:08:45,174 --> 00:08:47,340 και μασάζ τα δεδομένα, και κάνουν ό, τι θέλουν με αυτό. 157 00:08:47,340 --> 00:08:49,920 158 00:08:49,920 --> 00:08:54,045 >> Έτσι θέλουμε να κάνουμε αυτό διαθέσιμα στον κόσμο των δεδομένων. 159 00:08:54,045 --> 00:08:55,670 Λοιπόν, υπάρχουν μερικά επιπλοκές. 160 00:08:55,670 --> 00:08:58,540 Το ένα είναι ότι αυτά τα μεταδεδομένα είναι σε διαφορετικά συστήματα. 161 00:08:58,540 --> 00:09:01,110 Είναι σε διαφορετικές μορφές. 162 00:09:01,110 --> 00:09:04,719 Έτσι, υπάρχει κάποια εξομάλυνση η οποία πρέπει να συμβεί, 163 00:09:04,719 --> 00:09:08,010 που κανονικοποίηση είναι η διαδικασία της φέρνοντας τα πράγματα από διαφορετικές μορφές 164 00:09:08,010 --> 00:09:12,940 και τους χαρτογράφηση σε μια ενιαία μορφή έτσι ώστε τα πεδία θα ταιριάζουν. 165 00:09:12,940 --> 00:09:15,160 >> Υπάρχουν ορισμένοι περιορισμοί πνευματικών δικαιωμάτων. 166 00:09:15,160 --> 00:09:21,010 Περιέργως, η είσοδος καταλόγου για ένα βιβλίο που είναι υπεύθυνη για τα πνευματικά δικαιώματα. 167 00:09:21,010 --> 00:09:24,060 Έτσι, ακόμα κι αν είναι μόνο πληροφορίες που προέρχονται από το βιβλίο, 168 00:09:24,060 --> 00:09:25,330 είναι πνευματικά δικαιώματα. 169 00:09:25,330 --> 00:09:28,400 Και ανάλογα με το ποιος πραγματικά δημιουργήθηκε ότι τα μεταδεδομένα, 170 00:09:28,400 --> 00:09:32,175 ενδέχεται να υπάρχουν περιορισμοί σχετικά με το ποιος μπορεί να το διανείμει, παρόμοια to-- 171 00:09:32,175 --> 00:09:33,402 >> Δεν ξέρω. 172 00:09:33,402 --> 00:09:36,110 Μπορεί ή δεν μπορεί να είναι παρόμοιο η κατάσταση των στίχων του τραγουδιού, 173 00:09:36,110 --> 00:09:36,610 για παράδειγμα. 174 00:09:36,610 --> 00:09:38,560 Έτσι, όλοι γνωρίζουμε πως αυτό τηγάνια έξω. 175 00:09:38,560 --> 00:09:40,450 Έτσι θα πρέπει να πάρετε γύρω από αυτό το θέμα. 176 00:09:40,450 --> 00:09:44,910 >> Και στη συνέχεια, ένα άλλο κομμάτι είναι ότι υπάρχει ένας μεγάλος αριθμός δεδομένων. 177 00:09:44,910 --> 00:09:52,420 Έτσι, αν είμαι κάποιος που θέλει να εργαστεί με τα δεδομένα ή έχει μια δροσερή ιδέα, 178 00:09:52,420 --> 00:09:55,350 που ασχολούνται με 14 εκατομμύρια αρχεία στο laptop μου 179 00:09:55,350 --> 00:09:57,487 θα μπορούσε να είναι προβληματική και είναι δύσκολο να διαχειριστεί. 180 00:09:57,487 --> 00:09:59,320 Έτσι θέλουμε να μειώσουμε τα εμπόδια για τα άτομα 181 00:09:59,320 --> 00:10:02,130 να είναι σε θέση να συνεργαστεί με τα δεδομένα. 182 00:10:02,130 --> 00:10:07,880 >> Έτσι, η προσέγγιση που ελπίζουμε διευθύνσεις όλες αυτές τις ανησυχίες είναι τα δύο μέρη. 183 00:10:07,880 --> 00:10:11,770 Ένα χτίζει μια πλατφόρμα που παίρνει δεδομένα από όλες αυτές τις διαφορετικές πηγές 184 00:10:11,770 --> 00:10:14,350 και επιδεινώνει, ομαλοποιεί, εμπλουτίζει και καθιστά 185 00:10:14,350 --> 00:10:16,650 διαθέσιμο σε μια ενιαία θέση. 186 00:10:16,650 --> 00:10:20,950 Και αυτό καθιστά διαθέσιμο μέσω ένα κοινό API που οι άνθρωποι μπορούν να καλέσετε. 187 00:10:20,950 --> 00:10:24,430 >> Έτσι, ένα API είναι μια εφαρμογή Programming Interface. 188 00:10:24,430 --> 00:10:28,930 Και αυτό αναφέρεται βασικά σε ένα καταληκτικό σημείο που ένα σύστημα ή τεχνολογία 189 00:10:28,930 --> 00:10:31,720 μπορεί να καλέσει και να πάρει πίσω τα δεδομένα σε μια δομημένη μορφή με έναν τρόπο 190 00:10:31,720 --> 00:10:32,900 ότι μπορεί να χρησιμοποιηθεί. 191 00:10:32,900 --> 00:10:36,060 Έτσι δεν είναι εξαρτώμενη για τη μετάβαση σε ένα δικτυακό τόπο 192 00:10:36,060 --> 00:10:37,970 και απόξεση δεδομένα από από αυτό, για παράδειγμα. 193 00:10:37,970 --> 00:10:40,690 194 00:10:40,690 --> 00:10:45,010 >> Έτσι, αυτή είναι η αρχική σελίδα του Το στοιχείο API Βιβλιοθήκη Cloud, 195 00:10:45,010 --> 00:10:47,220 το οποίο είναι ουσιαστικά έκδοση του δύο. 196 00:10:47,220 --> 00:10:50,130 Έτσι είναι η δεύτερη επανάληψη του προσπαθούν να κάνουν όλα αυτά τα δεδομένα 197 00:10:50,130 --> 00:10:53,280 διαθέσιμα στον κόσμο. 198 00:10:53,280 --> 00:10:59,560 Έτσι είναι http://api.lib.harvard.edu/v2/items. 199 00:10:59,560 --> 00:11:03,830 Και μόνο για να σπάσει αυτό κάτω λίγο, τι σημαίνει αυτό 200 00:11:03,830 --> 00:11:06,115 είναι ότι πρόκειται για την έκδοση δύο του ΑΡΙ. 201 00:11:06,115 --> 00:11:08,490 Υπάρχει μια έκδοση One, η οποία Είμαι δεν πρόκειται να μιλήσω. 202 00:11:08,490 --> 00:11:09,750 Αλλά υπάρχει μια έκδοση ενός. 203 00:11:09,750 --> 00:11:14,740 >> Και αν είστε καλώντας αυτό API, παίρνετε τα στοιχεία. 204 00:11:14,740 --> 00:11:20,640 Και μέρος της ιδέας ενός API είναι ένα API είναι μια σύμβαση. 205 00:11:20,640 --> 00:11:23,440 Είναι κάτι που είναι δεν πρόκειται να αλλάξει. 206 00:11:23,440 --> 00:11:24,850 Έτσι, για παράδειγμα, - 207 00:11:24,850 --> 00:11:27,410 >> Και ο λόγος είναι ότι αν κατασκευή κάποιου είδους σύστημα που 208 00:11:27,410 --> 00:11:33,210 πρόκειται να χρησιμοποιήσει ένα σύννεφο βιβλιοθήκη API για να εμφανίσετε τα βιβλία ή να βοηθήσει τους ανθρώπους να βρουν 209 00:11:33,210 --> 00:11:36,190 πληροφορίες σε μοναδικούς τρόπους, τι δεν θέλουμε να συμβεί 210 00:11:36,190 --> 00:11:38,940 είναι για εμάς να πάμε αλλάξετε τον τρόπο ότι η API λειτουργεί, και ξαφνικά 211 00:11:38,940 --> 00:11:41,340 πάντα διαλείμματα από την πλευρά του τελικού χρήστη. 212 00:11:41,340 --> 00:11:46,710 Έτσι μέρος αν θέλετε να κάνετε API στη διάθεση του κόσμου, είναι 213 00:11:46,710 --> 00:11:49,396 καλή πρακτική να θέσει ένα αριθμός έκδοσης σε αυτό, ώστε οι άνθρωποι 214 00:11:49,396 --> 00:11:51,020 γνωρίζετε ποια έκδοση έχουμε να κάνουμε με. 215 00:11:51,020 --> 00:11:54,300 >> Έτσι, αν αποφασίσουμε να βρούμε έναν καλύτερο τρόπο τη διάθεση αυτές τις πληροφορίες, 216 00:11:54,300 --> 00:11:57,295 μπορούμε να αλλάξουμε ότι για να αμφισβητήσει την έκδοση τρία. 217 00:11:57,295 --> 00:11:59,920 Έτσι, ο καθένας ο οποίος εξακολουθεί να χρησιμοποιεί έκδοση δύο, ότι θα εξακολουθούν να εργάζονται. 218 00:11:59,920 --> 00:12:03,490 Αλλά έκδοση τρία θα έχουν όλα τα νέα πράγματα. 219 00:12:03,490 --> 00:12:06,680 220 00:12:06,680 --> 00:12:09,210 >> Έτσι, αυτό είναι ένα API, αλλά αυτό πραγματικά μοιάζει με μια διεύθυνση URL. 221 00:12:09,210 --> 00:12:11,680 Και έτσι ό, τι αυτό είναι ένα παράδειγμα είναι αυτό που είναι 222 00:12:11,680 --> 00:12:16,615 ονομάζεται ΑΡΙ ανάπαυσης, η οποία είναι διαθέσιμη πάνω ακριβώς τακτική σύνδεση στο διαδίκτυο. 223 00:12:16,615 --> 00:12:19,680 Και μπορείτε πραγματικά πηγαίνετε σε αυτό στο πρόγραμμα περιήγησης. 224 00:12:19,680 --> 00:12:28,550 >> Εδώ, λοιπόν, έχουμε μόλις άνοιξε τον Firefox και πάει να api.lib.harvard.edu/v2/items. 225 00:12:28,550 --> 00:12:31,560 Και έτσι αυτό που παίρνω εδώ είναι βασικά, η πρώτη σελίδα 226 00:12:31,560 --> 00:12:34,740 των αποτελεσμάτων από το σύνολο του σύνολο από στοιχεία που έχουμε. 227 00:12:34,740 --> 00:12:37,460 Και είναι εδώ σε μορφή XML. 228 00:12:37,460 --> 00:12:40,130 229 00:12:40,130 --> 00:12:42,210 Και αυτό είναι επίσης ωραιοποιημένη από τον Firefox. 230 00:12:42,210 --> 00:12:45,850 Δεν έχει πραγματικά όλα αυτά μικρή διαστολή και συστολή 231 00:12:45,850 --> 00:12:47,880 doohickeys εδώ. 232 00:12:47,880 --> 00:12:52,520 Αυτό είναι το είδος της ένα καλύτερο Έκδοση τρόπος να το δει κανείς. 233 00:12:52,520 --> 00:12:57,040 >> Αλλά τι είναι αυτό που μας λέει είναι Έχω ζήτησε όλα τα στοιχεία. 234 00:12:57,040 --> 00:13:03,120 Έτσι, υπάρχουν 13.289.475 αντικείμενα. 235 00:13:03,120 --> 00:13:06,150 Και κοιτάω την πρώτη 10, ξεκινώντας από τη θέση μηδέν 236 00:13:06,150 --> 00:13:09,760 επειδή στην επιστήμη των υπολογιστών εμείς πάντα ξεκινούν από το μηδέν. 237 00:13:09,760 --> 00:13:15,150 Και αυτό που έχω εδώ, αν θέλω απλώς να καταρρεύσει αυτό, θα δείτε έχω 10 αντικείμενα. 238 00:13:15,150 --> 00:13:20,410 239 00:13:20,410 --> 00:13:25,210 >> Και αν ρίξουμε μια ματιά σε ένα στοιχείο, μπορώ δείτε ότι έχω πληροφορίες σχετικά με αυτό. 240 00:13:25,210 --> 00:13:27,400 Και αυτό είναι ό, τι λέγεται μορφή MODS. 241 00:13:27,400 --> 00:13:30,860 Και έτσι Πάω να στραφούν πίσω εδώ για μια στιγμή. 242 00:13:30,860 --> 00:13:33,750 ΟΚ. 243 00:13:33,750 --> 00:13:37,447 >> Ας ψάξετε για κάτι ειδικά επειδή το πρώτο στοιχείο που 244 00:13:37,447 --> 00:13:40,030 συμβαίνει να καταλήξει όταν κοιτάς καθ 'όλη τη συλλογή 245 00:13:40,030 --> 00:13:41,750 είναι, εξ ορισμού, τυχαία. 246 00:13:41,750 --> 00:13:44,550 Ας ρίξουμε μια ματιά για κάποιες ντόνατς. 247 00:13:44,550 --> 00:13:46,830 Ω. 248 00:13:46,830 --> 00:13:49,190 >> ΟΚ. 249 00:13:49,190 --> 00:13:49,940 Έτσι ντόνατς. 250 00:13:49,940 --> 00:13:55,360 Έτσι βρήκαμε ότι υπάρχουν 80 είδη σε Η συλλογή που παραπέμπουν ντόνατς. 251 00:13:55,360 --> 00:13:57,150 Κοιτάμε τα πρώτα 10 από αυτούς. 252 00:13:57,150 --> 00:14:01,890 Τώρα, μπορείτε να δείτε εδώ ο τρόπος που Είπα Ψάχνω για ντόνατς, 253 00:14:01,890 --> 00:14:04,400 Θέλω μόνο να προσθέσει κάτι η συμβολοσειρά ερωτήματος της διεύθυνσης URL. 254 00:14:04,400 --> 00:14:09,680 Έτσι, Q είναι ίσο με ντόνατς, τα οποία μπορείτε να δείτε λίγο πιο εύκολα εδώ. 255 00:14:09,680 --> 00:14:12,131 >> Και αυτό σημαίνει ότι ουσιαστικά δεν υπάρχει spec για το API, το οποίο 256 00:14:12,131 --> 00:14:13,880 καθορίζει αυτό που όλοι σημαίνουν αυτές οι παράμετροι. 257 00:14:13,880 --> 00:14:17,150 Και αυτό δεν σημαίνει ότι πρόκειται να τα πάντα για λουκουμάδες αναζήτηση. 258 00:14:17,150 --> 00:14:24,910 >> Έτσι, το πρώτο στοιχείο που έχουμε εδώ μπορείτε να δείτε τον τίτλο είναι Donuts, 259 00:14:24,910 --> 00:14:29,310 και υπάρχει ένας υπότιτλος που ονομάζεται Αμερικανός Πάθος, το οποίο είναι, υποθέτω, 260 00:14:29,310 --> 00:14:31,610 κατάλληλες. 261 00:14:31,610 --> 00:14:36,134 Υπάρχουν πολλά different-- 262 00:14:36,134 --> 00:14:38,050 Μόλις φτάσετε στο σημείο να πάρει τα δεδομένα, 263 00:14:38,050 --> 00:14:41,020 υπάρχουν πολλά διαφορετικά μορφές που μπορείτε να το πάρετε σε. 264 00:14:41,020 --> 00:14:44,050 Και υπάρχουν διαφορετικές περιεκτικότητες και τις αδυναμίες για όλα αυτά. 265 00:14:44,050 --> 00:14:49,000 Έτσι, αυτό το ένα, μπορείτε να δείτε εδώ, αυτή η μορφή είναι πολύ πλούσια. 266 00:14:49,000 --> 00:14:51,946 Και αυτό είναι τυποποιημένες. 267 00:14:51,946 --> 00:14:55,040 >> Έτσι, υπάρχει ένα συγκεκριμένο τίτλο πεδίο, ένα πεδίο υπότιτλος. 268 00:14:55,040 --> 00:14:58,950 Υπάρχει μια εναλλακτική τίτλο, Ένας Αμερικανός Πάθος. 269 00:14:58,950 --> 00:15:01,650 Υπάρχει το όνομα που σχετίζεται με αυτό. 270 00:15:01,650 --> 00:15:03,120 Είδος του πόρου είναι κείμενο. 271 00:15:03,120 --> 00:15:06,070 Υπάρχουν πολλές πληροφορίες εδώ σε αυτή τη μορφή. 272 00:15:06,070 --> 00:15:09,480 >> Αλλά υπάρχουν ένα σωρό από διαφορετικές μορφές. 273 00:15:09,480 --> 00:15:11,920 Έτσι, αυτό που ήταν μόλις κοιτάζοντας είναι μια μορφή 274 00:15:11,920 --> 00:15:17,700 ονομάζεται MODS, που σημαίνει Μεταδεδομένα Αντικείμενο Περιγραφή Υπηρεσίας, 275 00:15:17,700 --> 00:15:18,250 δυνητικά. 276 00:15:18,250 --> 00:15:23,030 Είμαι πραγματικά δεν είναι αρκετά σίγουροι για το Σ Αλλά είναι μια αρκετά πολύπλοκη μορφή. 277 00:15:23,030 --> 00:15:24,240 Είναι η προεπιλεγμένη μορφή. 278 00:15:24,240 --> 00:15:30,260 >> Αλλά είναι αυτός που κρατά ο πλούτος όλων των δεδομένων 279 00:15:30,260 --> 00:15:33,820 ότι η βιβλιοθήκη έχει επειδή Είναι πολύ κοντά σε ό, τι 280 00:15:33,820 --> 00:15:35,110 η βιβλιοθήκη χρησιμοποιεί εσωτερικά. 281 00:15:35,110 --> 00:15:39,030 Είναι ένα πρότυπο που είναι που χρησιμοποιούνται σε όλη τη χώρα, 282 00:15:39,030 --> 00:15:40,944 σε όλο τον κόσμο σε ακαδημαϊκές βιβλιοθήκες. 283 00:15:40,944 --> 00:15:42,110 Και είναι πολύ διαλειτουργικό. 284 00:15:42,110 --> 00:15:44,852 Έτσι, εάν έχετε ένα έγγραφο ότι είναι σε μορφή MODS, 285 00:15:44,852 --> 00:15:47,560 μπορείτε να δώσετε ότι σε κάποιον άλλο συστήματα των οποίων κατανοούν MODS, 286 00:15:47,560 --> 00:15:48,518 και μπορούν να το εισάγει. 287 00:15:48,518 --> 00:15:50,840 Έτσι είναι ένα πρότυπο. 288 00:15:50,840 --> 00:15:54,250 Είναι πολύ καλά καθορισμένη, πολύ συγκεκριμένες. 289 00:15:54,250 --> 00:15:58,980 Και αυτό είναι που κάνει διαλειτουργικό γιατί αν κάποιος λέει, 290 00:15:58,980 --> 00:16:04,930 αυτή είναι η εναλλακτική τίτλος ενός ρεκόρ, όλοι γνωρίζουν τι σημαίνει αυτό. 291 00:16:04,930 --> 00:16:07,740 Από την άλλη πλευρά, είναι πολύ περίπλοκο. 292 00:16:07,740 --> 00:16:13,160 >> Έτσι, αν ρίξετε μια ματιά σε αυτό το ρεκόρ εδώ, 293 00:16:13,160 --> 00:16:15,320 αν απλά θέλετε να πάρετε το τίτλος αυτού του εγγράφου, 294 00:16:15,320 --> 00:16:21,150 αυτού του βιβλίου, το οποίο είναι πιθανώς Donuts, Ένας Αμερικανός Πάθος, το parsing έξω 295 00:16:21,150 --> 00:16:22,940 είναι λίγο εμπλέκονται. 296 00:16:22,940 --> 00:16:27,380 Εκτιμώντας υπάρχει ένα άλλο μορφή που ονομάζεται Dublin Core, 297 00:16:27,380 --> 00:16:29,730 το οποίο είναι ένα πολύ, πολύ απλούστερη μορφή. 298 00:16:29,730 --> 00:16:33,764 >> Και έτσι βλέπεις εδώ, δεν υπάρχει κανένας τίτλος, υπότιτλος, εναλλακτικό τίτλο. 299 00:16:33,764 --> 00:16:35,930 Υπάρχει μόνο ο τίτλος, Donuts, ένας Αμερικανός Πάθος, 300 00:16:35,930 --> 00:16:38,780 και άλλο τίτλο, Αμερικανός Πάθος. 301 00:16:38,780 --> 00:16:42,907 Έτσι, όταν ψάχνετε σε ποια μορφή θέλετε να πάρετε τα στοιχεία από, 302 00:16:42,907 --> 00:16:44,740 πολλά εξαρτώνται από το πώς θα πάμε να το χρησιμοποιήσετε. 303 00:16:44,740 --> 00:16:46,573 Χρησιμοποιείτε για διαλειτουργικότητα ή να κάνετε 304 00:16:46,573 --> 00:16:49,970 θέλουν κάτι απλό που θα μπορούσε να είναι πιο εύκολο να συνεργαστείς μαζί του; 305 00:16:49,970 --> 00:16:56,002 >> Από την άλλη πλευρά, ένα μεγάλο μέρος της λεπτομέρειες παίρνουν είδος συμπιεσμένη κάτω. 306 00:16:56,002 --> 00:16:58,460 Μπορεί να χάσετε τις αποχρώσεις του ό, τι ένα συγκεκριμένο μέσο πεδίο 307 00:16:58,460 --> 00:17:02,960 αν έχουμε να κάνουμε με το Dublin Core, το οποίο δεν θα πάρει με MODS. 308 00:17:02,960 --> 00:17:06,462 Έτσι, αυτές είναι δύο από τα φορμά μπορείτε να βγούμε από το API. 309 00:17:06,462 --> 00:17:08,920 Και βασικά, κρατάμε πίσω από τις σκηνές στο MODS. 310 00:17:08,920 --> 00:17:14,179 Αλλά μπορούμε να σας δώσουμε το στο MODS και Dublin Core και οτιδήποτε άλλο, καθώς και. 311 00:17:14,179 --> 00:17:16,470 Η άλλη μελέτη, όταν ψάχνετε στα δεδομένα 312 00:17:16,470 --> 00:17:21,210 είναι ότι μπορείτε να πάρετε είτε ως JSON, το οποίο σημαίνει JavaScript Object Notation, 313 00:17:21,210 --> 00:17:24,720 ή XML, το οποίο αντιπροσωπεύει Extensible Markup Language. 314 00:17:24,720 --> 00:17:30,080 Και αυτές οι αναπαραστάσεις δεδομένων, τόσο έχουν ακριβώς τα ίδια δεδομένα, ακριβώς 315 00:17:30,080 --> 00:17:31,080 τα ίδια πεδία. 316 00:17:31,080 --> 00:17:33,644 Αλλά είναι ακριβώς συντακτικά διαφορετικοί. 317 00:17:33,644 --> 00:17:40,401 >> Έτσι, αυτό είναι a-- 318 00:17:40,401 --> 00:17:41,400 Λοιπόν, ας αλλάξουν. 319 00:17:41,400 --> 00:17:47,490 Έτσι, αυτό είναι το ερώτημα μας για ντόνατς σε μορφή XML. 320 00:17:47,490 --> 00:17:53,470 Αν ήμουν απλά διακόπτης αυτός να είναι JSON, Μπορώ να δω φαίνεται διαφορετική. 321 00:17:53,470 --> 00:17:58,580 Μέχρι τώρα αυτό είναι το ίδιο περιεχόμενο, αλλά μια διαφορετική δομή. 322 00:17:58,580 --> 00:18:00,080 Υπάρχουν λιγότερα στηρίγματα γωνία. 323 00:18:00,080 --> 00:18:02,530 Υπάρχει λιγότερη λεπτομέρεια. 324 00:18:02,530 --> 00:18:06,440 >> Και αυτό είναι μια μορφή που, αν εργάζονται σε περιβάλλον web, 325 00:18:06,440 --> 00:18:09,680 που είναι πιο πιθανό θα να θέλουν να χρησιμοποιήσουν ένα 326 00:18:09,680 --> 00:18:12,630 από τα ωραία πράγματα για το JSON είναι είναι συμβατή με JavaScript. 327 00:18:12,630 --> 00:18:17,680 Έτσι, αν γράφω Web App, μπορώ να τραβήξει σε JSON και μόλις εργαστείτε με αυτό άμεσα. 328 00:18:17,680 --> 00:18:20,187 Ότι, με την XML, είναι μια λίγο πιο περίπλοκη. 329 00:18:20,187 --> 00:18:21,520 Έτσι και πάλι, αυτά είναι τόσο χρήσιμα. 330 00:18:21,520 --> 00:18:26,387 Απλώς είναι διαφορετικές περιπτώσεις χρήσης όπου οι άνθρωποι μπορεί να θέλουν να τα χρησιμοποιούν. 331 00:18:26,387 --> 00:18:26,886 ΟΚ. 332 00:18:26,886 --> 00:18:29,810 333 00:18:29,810 --> 00:18:31,680 Έτσι, πίσω στο API. 334 00:18:31,680 --> 00:18:32,900 Έτσι, μπορούμε να ψάξουμε for-- 335 00:18:32,900 --> 00:18:36,220 >> Δίνω ένα παράδειγμα ψάχνουν για ντόνατς. 336 00:18:36,220 --> 00:18:39,330 Μπορούμε επίσης να ψάξετε μόνο σε ένα συγκεκριμένο τομέα μέσα εδώ. 337 00:18:39,330 --> 00:18:41,310 Έτσι, αντί να ψάχνουν ολόκληρο το αρχείο, 338 00:18:41,310 --> 00:18:43,870 Μπορώ να ψάξει ακριβώς το πεδίο του τίτλου. 339 00:18:43,870 --> 00:18:48,810 Και έτσι τώρα υπάρχουν 25 πράγματα ότι έχουν ντόνατς στον τίτλο, μία εκ των οποίων 340 00:18:48,810 --> 00:18:52,430 είναι για την αποκατάσταση υγροτόπων στη διαχείριση 341 00:18:52,430 --> 00:18:54,990 της οπής στο ντόνατ προγράμματος, το οποίο είναι πιθανώς 342 00:18:54,990 --> 00:18:58,970 δεν είναι απαραίτητα αυτό που ψάχνουμε για όταν είμαστε ψάχνουν για ντόνατς. 343 00:18:58,970 --> 00:19:02,790 344 00:19:02,790 --> 00:19:05,490 >> Μπορείτε επίσης, όταν είστε που ασχολούνται με API-- 345 00:19:05,490 --> 00:19:08,827 >> Μέρος της ύπαρξης ενός API δίνει οι άνθρωποι έχουν πρόσβαση σε μεγάλα σύνολα δεδομένων. 346 00:19:08,827 --> 00:19:11,410 Και υπάρχουν μια-δυο διαφορετικούς εργαλεία που μπορείτε να χρησιμοποιήσετε για να το κάνουμε αυτό. 347 00:19:11,410 --> 00:19:14,170 Το ένα είναι, πολύ απλά, να ξεφυλλίσετε τα δεδομένα. 348 00:19:14,170 --> 00:19:17,340 Έτσι ακριβώς όπως αν κάνετε ένα ερώτημα μέσω ενός web interface, 349 00:19:17,340 --> 00:19:19,470 μπορείτε να δείτε στη σελίδα ένα, σελίδα δύο, τρία σελίδα. 350 00:19:19,470 --> 00:19:22,040 Μπορείτε να κάνετε το ίδιο πράγμα μέσω του API. 351 00:19:22,040 --> 00:19:24,150 Απλά πρέπει να είναι σαφείς ως προς το πώς το κάνεις. 352 00:19:24,150 --> 00:19:29,511 >> Έτσι, για παράδειγμα, αν ψάχνω στο πρώτο μου ερώτημα εδώ, 353 00:19:29,511 --> 00:19:32,510 όπου κάνω μια αναζήτηση για τα πράγματα με λουκουμάδες στον τίτλο, μπορώ να πω, 354 00:19:32,510 --> 00:19:35,415 και το όριο ισούται με 20, πράγμα που σημαίνει να μου δώσει τις πρώτες 20 εγγραφές, δεν 355 00:19:35,415 --> 00:19:38,540 το πρώτο 10, το οποίο είναι η προεπιλογή, γιατί θέλω να δούμε 20 σε έναν χρόνο. 356 00:19:38,540 --> 00:19:43,435 Ή μπορώ να πω, που η ξεκινήστε ίση με 20 και όριο 357 00:19:43,435 --> 00:19:47,150 ισούται με 20, η οποία θα δώσει Θέλω να καταγράφει 21 έως 40. 358 00:19:47,150 --> 00:19:52,680 >> Έτσι υποθέτω ότι το πράγμα να πάρει εδώ είναι 359 00:19:52,680 --> 00:19:57,290 ότι είμαστε χρησιμοποιώντας τις χορδές ερωτήματος να ρυθμίσετε τις παραμέτρους για το ερώτημα. 360 00:19:57,290 --> 00:20:02,760 Και αυτό επιτρέπει τον έλεγχο σας ό, τι μπορείτε να πάρετε πίσω. 361 00:20:02,760 --> 00:20:05,980 >> Ένα άλλο εργαλείο που μπορείτε να χρησιμοποιήσετε, - 362 00:20:05,980 --> 00:20:09,250 >> Και αυτό είναι πραγματικά χρήσιμη όσον αφορά την εξερεύνηση των δεδομένων. 363 00:20:09,250 --> 00:20:10,840 >> --is κάτι που ονομάζεται εδρικοποίηση. 364 00:20:10,840 --> 00:20:15,530 Έτσι, ο όρος είναι εδρικοποίηση όχι κατ 'ανάγκη κοινά. 365 00:20:15,530 --> 00:20:16,880 Αλλά έχετε όλοι δει πριν. 366 00:20:16,880 --> 00:20:18,630 Αν ρίξετε μια ματιά Amazon, για παράδειγμα, 367 00:20:18,630 --> 00:20:20,870 και κάνετε μια αναζήτηση για ντόνατς στα βιβλία, 368 00:20:20,870 --> 00:20:27,080 Εδώ έχουμε μια σειρά από βιβλία, Και είναι ομαδοποιημένα κατά κατηγορία, 369 00:20:27,080 --> 00:20:30,470 και μπορείτε να πάρετε τις διάφορες κατηγορίες, και πόσα βιβλία σε κάθε κατηγορία 370 00:20:30,470 --> 00:20:31,330 εμφανίζονται. 371 00:20:31,330 --> 00:20:33,420 >> Έτσι, αυτό είναι βασικά μια πτυχή. 372 00:20:33,420 --> 00:20:37,570 Μπορείτε να πάρετε όλα τα βιβλία τους, το 1800 βιβλία που ταιριάζουν με ντόνατς στο Amazon. 373 00:20:37,570 --> 00:20:39,820 12 από αυτά βρίσκονται στο Κατηγορία πρωινό. 374 00:20:39,820 --> 00:20:43,100 21 ζαχαροπλαστικής και αρτοποιίας, και ούτω καθεξής και ούτω καθεξής. 375 00:20:43,100 --> 00:20:47,670 >> Έτσι, αυτό είναι πραγματικά μια χρήσιμη εργαλείο για την εξερεύνηση του περιεχομένου 376 00:20:47,670 --> 00:20:53,260 εντός της βιβλιοθήκης, καθώς και γιατί όταν κοιτάς μια έκφανση, 377 00:20:53,260 --> 00:20:56,520 σας δίνει μια ιδέα για το ποια θέματα υπάρχει, όπως ποιοι τύποι θεμάτων 378 00:20:56,520 --> 00:20:58,510 είναι πιο δημοφιλής στο σύνολο του ερωτήματός σας. 379 00:20:58,510 --> 00:21:00,950 Και αυτό σας βοηθά να εκδιωχθεί και να εξερευνήσετε. 380 00:21:00,950 --> 00:21:02,770 Έτσι, μπορούμε να κάνουμε το ίδιο πράγμα. 381 00:21:02,770 --> 00:21:05,940 >> Αν θέλουμε να χρησιμοποιήσουμε το API και να εξετάσουμε τις πτυχές, 382 00:21:05,940 --> 00:21:08,950 προσθέτουμε μια άλλη παράμετρο για ο φίλος μας ο συμβολοσειρά ερωτήματος. 383 00:21:08,950 --> 00:21:12,540 Έτσι έδρες ισοδυναμεί με διαχωρισμένες με κόμμα λίστα με το τι θέλουμε να έκφανση επάνω. 384 00:21:12,540 --> 00:21:14,790 Έτσι, μία από τις πτυχές μπορεί να είναι αντικείμενο. 385 00:21:14,790 --> 00:21:16,565 Ένας άλλος θα μπορούσε να είναι γλώσσα. 386 00:21:16,565 --> 00:21:19,665 Και έτσι αν τρέξουμε αυτό το ερώτημα, εμείς get-- 387 00:21:19,665 --> 00:21:23,372 388 00:21:23,372 --> 00:21:24,830 Φαίνεται λίγο πολύ το ίδιο εδώ. 389 00:21:24,830 --> 00:21:29,010 Αλλά έχουμε προσθέσει στο τέλος από τον κατάλογο μια σειρά από πτυχές. 390 00:21:29,010 --> 00:21:34,060 Έτσι, έχουμε μια πτυχή που ονομάζεται θέμα. 391 00:21:34,060 --> 00:21:40,250 Έτσι, αυτό μας λέει ότι αν κοιτάξω 80 αποτελέσματα μου από το ερώτημα ντόνατ, 392 00:21:40,250 --> 00:21:42,100 13 από αυτά έχουν την υποβάλλουν Ηνωμένες Πολιτείες. 393 00:21:42,100 --> 00:21:43,684 Τρεις έχουν τα ντόνατς θέμα. 394 00:21:43,684 --> 00:21:45,600 Τρεις έχουν το θέμα της αποκατάστασης υγροτόπων, 395 00:21:45,600 --> 00:21:47,720 που μπορεί να είναι τρύπα μας στο ντόνατ. 396 00:21:47,720 --> 00:21:51,780 Δύο από αυτούς, οι Simpsons, και ούτω καθεξής και ούτω καθεξής. 397 00:21:51,780 --> 00:21:59,211 >> Έτσι, αυτό μπορεί να είναι χρήσιμο αν θέλετε να περιορίσετε την αναζήτησή σας. 398 00:21:59,211 --> 00:22:00,210 Μπορεί να σας βοηθήσει να το κάνουμε αυτό. 399 00:22:00,210 --> 00:22:03,580 Ειδικά αν έχετε περισσότερο από ό, τι, ας πούμε, 80 αποτελέσματα. 400 00:22:03,580 --> 00:22:05,980 >> Επίσης, ζητήσαμε επίσης για έδρες επί γλώσσα. 401 00:22:05,980 --> 00:22:14,790 Έτσι, αν κοιτάξουμε τα αποτελέσματά μας, βλέπουμε 76 από αυτούς είναι στην αγγλική γλώσσα, τέσσερα στα γαλλικά, 402 00:22:14,790 --> 00:22:19,620 δύο στα ισπανικά, δύο, νομίζω ότι αυτό είναι απροσδιόριστη ή άγνωστη, ολλανδικά και τα λατινικά. 403 00:22:19,620 --> 00:22:22,830 Πιστεύω λοιπόν ότι το λατινικό ντόνατ αποτέλεσμα, και πάλι, 404 00:22:22,830 --> 00:22:24,922 δεν έχει τίποτα να κάνει με τα ψημένα αγαθά. 405 00:22:24,922 --> 00:22:25,630 Αλλά εκεί θα πάτε. 406 00:22:25,630 --> 00:22:31,420 407 00:22:31,420 --> 00:22:38,630 >> Έτσι, αυτό είναι το είδος της δείχνοντάς σας πώς μπορείτε να τραβήξετε το περιεχόμενο πίσω 408 00:22:38,630 --> 00:22:41,270 από το API του μόνο μέσω της web browser, η οποία είναι μεγάλη. 409 00:22:41,270 --> 00:22:44,320 Αλλά δεν είναι πραγματικά ό, τι θα κάνατε κανονικά να είναι σε χρήση API για αυτό. 410 00:22:44,320 --> 00:22:48,710 Έτσι, ένα παράδειγμα για το πώς θα θα μπορούσε πραγματικά να το κάνετε αυτό είναι που έχω 411 00:22:48,710 --> 00:22:54,720 γράψει ένα σούπερ μικρό πρόγραμμα, η οποία, και πάλι, κάνει αναζήτηση ντόνατ μου 412 00:22:54,720 --> 00:22:59,010 και επιλέγει ένα ζευγάρι πεδία και τα εμφανίζει σε έναν πίνακα. 413 00:22:59,010 --> 00:23:01,610 Έτσι, αυτό είναι πάρα πολύ η ίδιο περιεχόμενο που μόλις 414 00:23:01,610 --> 00:23:04,830 πριόνι με λίγα πεδία τράβηξε έξω. 415 00:23:04,830 --> 00:23:12,090 Έτσι, λίστα με τους τίτλους, τα τοποθεσία του τι το βιβλίο 416 00:23:12,090 --> 00:23:15,120 είναι περίπου, η γλώσσα, και ούτω καθεξής και ούτω καθεξής. 417 00:23:15,120 --> 00:23:20,480 >> Πώς, λοιπόν, αυτό που πραγματικά συνέβη, επειδή Υποθέτω ότι θα πρέπει να εξετάσουμε σε κάποιο κώδικα, 418 00:23:20,480 --> 00:23:22,420 is-- 419 00:23:22,420 --> 00:23:28,060 >> Αυτό που έχουμε εδώ είναι μια απλή HTML σελίδα, η οποία εμφανίζει το κείμενο, 420 00:23:28,060 --> 00:23:32,900 καλώς ήλθατε σύννεφο της βιβλιοθήκης και στη συνέχεια, εμφανίζει έναν πίνακα των αποτελεσμάτων. 421 00:23:32,900 --> 00:23:37,790 Και προφανώς να μην υπάρχουν αποτελέσματα ο πίνακας όταν η σελίδα φορτώνει. 422 00:23:37,790 --> 00:23:41,380 Αλλά τι κάνουμε Είναι, πρώτα απ 'όλα, 423 00:23:41,380 --> 00:23:46,290 τοποθετείτε ένα βιβλιοθήκη που ονομάζεται jQuery, η οποία είναι βασικά 424 00:23:46,290 --> 00:23:52,030 μια βιβλιοθήκη JavaScript, το οποίο καθιστά πολύ εύκολο να χειραγωγήσουν το JavaScript 425 00:23:52,030 --> 00:23:58,780 εγγενώς, HTML, και τη δημιουργία ιστοσελίδων, client-side λογική και ιστοσελίδες. 426 00:23:58,780 --> 00:24:01,595 >> Έτσι, αυτό που έχουμε εδώ είναι jQuery έχει μια μέθοδο που ονομάζεται πάρει, 427 00:24:01,595 --> 00:24:05,270 που ουσιαστικά θα πάει στο ένα URL, η οποία, στην περίπτωση αυτή, 428 00:24:05,270 --> 00:24:09,070 Είναι αυτή η οικεία διεύθυνση URL που αναζητούν. 429 00:24:09,070 --> 00:24:14,440 Και τότε θα πάρει το περιεχόμενο από ότι η διεύθυνση URL και στη συνέχεια να εκτελέσετε μια λειτουργία σε αυτό. 430 00:24:14,440 --> 00:24:19,240 Έτσι είπαμε πάμε να api.lib.harvard / edu. 431 00:24:19,240 --> 00:24:20,060 Αναζήτηση για λουκουμάδες. 432 00:24:20,060 --> 00:24:21,300 Δώστε μας 20 εγγραφές. 433 00:24:21,300 --> 00:24:28,590 Και στη συνέχεια, εκτελέστε αυτή τη λειτουργία, η οποία Έχω επιλέξει, περνώντας τα δεδομένα. 434 00:24:28,590 --> 00:24:34,430 Και τα δεδομένα είναι το JSON ότι πήρε επέστρεψε από το API. 435 00:24:34,430 --> 00:24:40,120 >> Και μετά λέμε, μέσα σε αυτό δεδομένα υπάρχει ένα πεδίο που ονομάζεται στοιχείο. 436 00:24:40,120 --> 00:24:48,117 Και αν πάω ρίξετε μια ματιά πίσω στο ένα από αυτά τα αποτελέσματα που είναι εδώ, 437 00:24:48,117 --> 00:24:49,200 υπάρχει κάτι called-- 438 00:24:49,200 --> 00:24:50,220 >> Λοιπόν, αυτό λέγεται σημείο. 439 00:24:50,220 --> 00:24:53,520 Έτσι ώστε να μπορεί να είναι ότι. 440 00:24:53,520 --> 00:25:01,840 Και αυτό που κάνει είναι να περνά από κάθε σημείο 441 00:25:01,840 --> 00:25:05,300 και στη συνέχεια καλεί ένα άλλο λειτουργία σε κάθε σημείο. 442 00:25:05,300 --> 00:25:08,440 Και αυτή η λειτουργία βασικά λαμβάνει την τιμή 443 00:25:08,440 --> 00:25:12,010 του αντικειμένου, η οποία είναι ουσιαστικά η μεμονωμένη εγγραφή 444 00:25:12,010 --> 00:25:18,220 και μας επιτρέπει να αποχωρήσει από τον τίτλο, η κάλυψη και η γλώσσα. 445 00:25:18,220 --> 00:25:21,640 >> Έτσι, καλούμε μια συνάρτηση για κάθε στοιχείο που πήραμε πίσω από το API. 446 00:25:21,640 --> 00:25:25,397 Και αν απλά ρίξτε μια ματιά σε αυτό το κομμάτι εδώ, 447 00:25:25,397 --> 00:25:27,230 αυτό που κάνουμε είναι δημιουργούμε ένα string, 448 00:25:27,230 --> 00:25:31,810 το οποίο είναι ουσιαστικά κάποια σήμανση HTML γύρω από ένα τραπέζι, με value.title, 449 00:25:31,810 --> 00:25:35,790 η οποία είναι ο τίτλος του αντικείμενο, value.coverage, 450 00:25:35,790 --> 00:25:36,790 η οποία είναι η κάλυψη, - 451 00:25:36,790 --> 00:25:38,225 >> Και κάνουμε μια επιταγή εδώ για να δείτε ποιος είναι απροσδιόριστο 452 00:25:38,225 --> 00:25:40,570 και κρύβοντας το αν λέει απροσδιόριστο, επειδή δεν είμαστε πραγματικά ενδιαφέρονται 453 00:25:40,570 --> 00:25:41,600 από το ότι. 454 00:25:41,600 --> 00:25:42,939 >> --and τότε η γλώσσα. 455 00:25:42,939 --> 00:25:44,730 Και τότε τι είμαστε κάνει επισυνάπτει ότι 456 00:25:44,730 --> 00:25:48,510 στο τραπέζι που είναι προσδιορίζονται από αυτό το κορδόνι εδώ. 457 00:25:48,510 --> 00:25:50,790 Και πώς λειτουργεί jQuery είναι ό, τι λέει αυτό 458 00:25:50,790 --> 00:25:56,420 είναι να κοιτάξουμε για το τραπέζι με την ιδέα αποτελέσματα και να προσθέσετε αυτό το κείμενο σε αυτό. 459 00:25:56,420 --> 00:25:59,380 Και αυτό είναι ο πίνακας με τα αποτελέσματα ιδέα. 460 00:25:59,380 --> 00:26:04,998 Έτσι, αυτό που θα καταλήξετε με αυτή τη σελίδα είναι εδώ. 461 00:26:04,998 --> 00:26:06,206 Και για να δείτε source-- 462 00:26:06,206 --> 00:26:11,310 463 00:26:11,310 --> 00:26:13,810 Λοιπόν, η πηγή δεν είναι στην πραγματικότητα ενημερώνεται, όταν αυτό συνέβη. 464 00:26:13,810 --> 00:26:18,740 Έτσι, μπορείτε να δείτε το πραγματικό αποτελέσματα του πίνακα εδώ όμως. 465 00:26:18,740 --> 00:26:24,770 >> Έτσι, αυτό είναι μόνο ένα απλό παράδειγμα κάνει ένα πολύ βασικό ερώτημα σε σχέση με το API 466 00:26:24,770 --> 00:26:29,020 και εμφάνιση πληροφοριών σε κάποιο άλλο αποτελούν, και να μην κάνουν τίποτα πάρα πολύ φανταχτερό. 467 00:26:29,020 --> 00:26:36,370 Τώρα, ένα άλλο παράδειγμα είναι σαν ένα εφαρμογή γράφτηκε από τον David Weinberger 468 00:26:36,370 --> 00:26:39,120 ως ένα demo του αυτό, το οποίο σας δείχνει ουσιαστικά 469 00:26:39,120 --> 00:26:44,620 πώς μπορείτε να mash up των αποτελεσμάτων είστε να πάρει από το σύννεφο βιβλιοθήκη API 470 00:26:44,620 --> 00:26:46,250 με, ας πούμε, το Google Books. 471 00:26:46,250 --> 00:26:52,225 >> Και η σκέψη εδώ είναι ότι μπορώ να εκτελέσετε ένα ερώτημα σε σχέση με το Google Books, 472 00:26:52,225 --> 00:26:56,060 να πάρετε μια πλήρη αναζήτηση κειμένου, να πάρει κάποια αποτελέσματα πίσω, να μάθετε ποια από αυτά τα στοιχεία 473 00:26:56,060 --> 00:27:01,180 πράγματι υπάρχουν σε Hollis, το σύστημα της βιβλιοθήκης, 474 00:27:01,180 --> 00:27:03,200 και στη συνέχεια να μου δώσει συνδέσεις πίσω στα στοιχεία αυτά. 475 00:27:03,200 --> 00:27:12,730 Έτσι, αν μπορώ να ψάξω για, ήταν μια σκοτεινή και θυελλώδης νύχτα, 476 00:27:12,730 --> 00:27:16,210 να πάρει πίσω μια δέσμη των αποτελεσμάτων από την Google, και στη συνέχεια, ένα αποτέλεσμα 477 00:27:16,210 --> 00:27:19,460 η οποία είναι μια ρυτίδα στο χρόνο. 478 00:27:19,460 --> 00:27:29,330 Και αυτοί είναι οι συνδέσεις με τα βιβλία που υπάρχουν στο πλαίσιο του συστήματος του Χάρβαρντ Βιβλιοθήκη. 479 00:27:29,330 --> 00:27:32,160 >> Έτσι υποθέτω ότι το θέμα εδώ δεν είναι τόσο πολύ που αυτό μπορεί ή δεν μπορεί να 480 00:27:32,160 --> 00:27:34,118 είναι ο τρόπος που θέλετε για να αναζητήσετε τη βιβλιοθήκη, 481 00:27:34,118 --> 00:27:38,310 αλλά αυτό είναι ένα εντελώς διαφορετικό τρόπο που δεν ήταν στη διάθεσή σας 482 00:27:38,310 --> 00:27:42,884 πριν, όπως σας είχε κανένα τρόπο να κάνουμε πλήρες κείμενο ψάχνει για τα βιβλία που ακόμα 483 00:27:42,884 --> 00:27:44,550 ήταν μέρος του συστήματος του Χάρβαρντ Βιβλιοθήκη. 484 00:27:44,550 --> 00:27:46,870 Μέχρι τώρα αυτός είναι ένας τρόπος ότι μπορείτε να το κάνετε αυτό. 485 00:27:46,870 --> 00:27:51,930 Και μπορείτε να τα εμφανίσετε σε ανεξάρτητα από τη μορφή που θέλετε. 486 00:27:51,930 --> 00:27:55,990 Έτσι, το σημείο εδώ είναι, βασικά, είμαστε ανοίγοντας νέους δρόμους για τους ανθρώπους 487 00:27:55,990 --> 00:27:59,080 να συνεργαστεί με τα δεδομένα. 488 00:27:59,080 --> 00:28:07,925 >> Ένα άλλο κομμάτι του cloud βιβλιοθήκης είναι ότι βοηθά να εκθέσει ορισμένα από τα δεδομένα χρήσης 489 00:28:07,925 --> 00:28:08,800 ότι η βιβλιοθήκη έχει. 490 00:28:08,800 --> 00:28:12,630 Έτσι, αν πάτε στη βιβλιοθήκη, και ψάχνετε για βιβλία, 491 00:28:12,630 --> 00:28:15,770 Δεν είναι υποχρεωτικό πραγματικά έχετε μια ιδέα, 492 00:28:15,770 --> 00:28:19,080 για όλα τα στοιχεία σε ένα συγκεκριμένο θέμα, τι 493 00:28:19,080 --> 00:28:21,200 οι άνθρωποι στην κοινότητα, είτε πρόκειται για 494 00:28:21,200 --> 00:28:24,890 ορίζεται ως το Χάρβαρντ ή το χώρα ή την τάξη σας, 495 00:28:24,890 --> 00:28:26,421 Τι έχουν βρει πιο χρήσιμο; 496 00:28:26,421 --> 00:28:28,920 Και η βιβλιοθήκη έχει ένα πραγματικά τόνο των πληροφοριών σχετικά με το τι 497 00:28:28,920 --> 00:28:32,999 είναι πιο χρήσιμο γιατί αν πολλά των ανθρώπων που ελέγχουν ένα βιβλίο, 498 00:28:32,999 --> 00:28:34,040 αυτό σας λέει κάτι. 499 00:28:34,040 --> 00:28:36,498 Πρέπει να υπήρχε κάποιος λόγος θέλουν να το ελέγξουμε. 500 00:28:36,498 --> 00:28:38,270 Πολλοί άνθρωποι που έχουν διατεθεί στην εφεδρεία. 501 00:28:38,270 --> 00:28:42,520 >> Αν είναι στον πίνακα επιτυχόντων για πολλά των κατηγοριών, ότι σας λέει κάτι. 502 00:28:42,520 --> 00:28:45,960 Αν τα μέλη ΔΕΠ ελέγχουμε από πολλά και προπτυχιακούς φοιτητές δεν είναι, 503 00:28:45,960 --> 00:28:47,200 ότι μου λέει κάτι. 504 00:28:47,200 --> 00:28:49,280 Αντιστρόφως, δηλαδή επίσης σας λέει κάτι. 505 00:28:49,280 --> 00:28:54,680 Έτσι, θα ήταν πραγματικά ενδιαφέρον να οι πληροφορίες αυτές τίθενται εκεί έξω και αφήστε 506 00:28:54,680 --> 00:28:59,969 άνθρωποι το χρησιμοποιούν για να τους βοηθήσουν να βρουν λειτουργεί στο πλαίσιο του συστήματος της βιβλιοθήκης. 507 00:28:59,969 --> 00:29:02,260 Η άλλη πλευρά είναι υπάρχουν κάποια σοβαρή προστασία της ιδιωτικής ζωής 508 00:29:02,260 --> 00:29:07,854 ανησυχίες, διότι ένα από τα βασικά χαρακτηριστικά της βιβλιοθήκης 509 00:29:07,854 --> 00:29:10,770 είναι ότι δεν πρόκειται να πει οι άνθρωποι ό, τι άλλοι άνθρωποι διαβάζουν. 510 00:29:10,770 --> 00:29:17,360 Και ακόμα κι αν λέτε αυτό βιβλίο ελέγχθηκε τέσσερις φορές 511 00:29:17,360 --> 00:29:20,070 σε ένα συγκεκριμένο μήνα, ότι θα μπορούσε να χρησιμοποιηθεί 512 00:29:20,070 --> 00:29:25,252 να συνδέσει πίσω σε μια συγκεκριμένη πρόσωπο με τα δεδομένα de-ανωνυμοποίηση 513 00:29:25,252 --> 00:29:26,710 και να ανακαλύψει ποιος ελεγχθεί έξω. 514 00:29:26,710 --> 00:29:30,792 Έτσι, ο τρόπος με τον οποίο μπορούμε να avoid-- 515 00:29:30,792 --> 00:29:33,750 Ο τρόπος με τον οποίο μπορούμε να προσπαθήσουμε να εξαγάγετε κάποιο σήμα από όλες τις πληροφορίες 516 00:29:33,750 --> 00:29:36,740 χωρίς να παραβιάζεται της ιδιωτικής ζωής κανενός 517 00:29:36,740 --> 00:29:42,150 είναι ουσιαστικά κοιτάμε 10 χρόνια δεδομένα χρήσης, - 518 00:29:42,150 --> 00:29:43,930 >> Έτσι είναι επί μακρό χρονικό διάστημα. 519 00:29:43,930 --> 00:29:50,639 >> --and να πω, εντάξει, ας δούμε πώς πολλές φορές το έργο αυτό χρησιμοποιήθηκε, 520 00:29:50,639 --> 00:29:52,930 και οι οποίοι κατά τη διάρκεια αυτής της περιόδου του χρόνου, και, στη συνέχεια, βασικά 521 00:29:52,930 --> 00:29:56,300 δώσει πίσω ένα αριθμό, που εμείς ονομάζουμε ένα σκορ στοίβα, η οποία βασικά 522 00:29:56,300 --> 00:29:59,910 αντιπροσωπεύει το πόσο έχει χρησιμοποιηθεί. 523 00:29:59,910 --> 00:30:01,084 Και αυτό number-- 524 00:30:01,084 --> 00:30:03,250 Πολλοί από διαφορετικούς υπολογισμούς μπω σε αυτόν τον αριθμό. 525 00:30:03,250 --> 00:30:05,150 --but είναι μια πολύ πρόχειρη μετρικό που σας δίνει 526 00:30:05,150 --> 00:30:11,300 κάποια ιδέα για το πώς η κοινότητα μπορεί να αποτιμά το έργο αυτό. 527 00:30:11,300 --> 00:30:16,772 >> Και έτσι ένα άλλο είδος, ακόμη και περισσότερα συμπληρωθούν εφαρμογή 528 00:30:16,772 --> 00:30:18,480 ότι εκμεταλλεύεται από αυτό είναι κάτι 529 00:30:18,480 --> 00:30:24,000 ονομάζεται Stacklife, η οποία είναι στην πραγματικότητα διαθέσιμες μέσω του βασικού του Χάρβαρντ 530 00:30:24,000 --> 00:30:24,880 Πύλη της Βιβλιοθήκης. 531 00:30:24,880 --> 00:30:26,700 Έτσι, μπορείτε να πάτε να library.harvard.edu. 532 00:30:26,700 --> 00:30:29,360 Θα δείτε έναν αριθμό διαφορετικών τρόπους αναζήτησης της βιβλιοθήκης. 533 00:30:29,360 --> 00:30:32,300 Και ένας από αυτούς ονομάζεται Stacklife. 534 00:30:32,300 --> 00:30:38,980 >> Και αυτό είναι μια εφαρμογή που περιηγείται το περιεχόμενο της βιβλιοθήκης, 535 00:30:38,980 --> 00:30:43,490 αλλά είναι πλήρως ενσωματωμένη στην κορυφή αυτών των ΑΡΙ. 536 00:30:43,490 --> 00:30:46,910 Έτσι, δεν υπάρχει ειδική ουσία συμβαίνει πίσω από τις σκηνές. 537 00:30:46,910 --> 00:30:49,570 Δεν υπάρχει πρόσβαση στο δεδομένα που δεν έχετε. 538 00:30:49,570 --> 00:30:54,090 Είναι χρησιμοποιώντας τα APIs για να σας παρέχει με μια εντελώς διαφορετική περιήγηση 539 00:30:54,090 --> 00:30:55,480 εμπειρία. 540 00:30:55,480 --> 00:30:58,570 >> Έτσι, αν μπορώ να ψάξω για την Αλίκη στη χώρα των θαυμάτων σε αυτή την περίπτωση, 541 00:30:58,570 --> 00:31:02,600 Έχω πάρει ένα αποτέλεσμα που μοιάζει με αυτό, το οποίο είναι αρκετά much-- 542 00:31:02,600 --> 00:31:05,430 543 00:31:05,430 --> 00:31:10,870 >> Είναι πολύ παρόμοιο με οποιαδήποτε άλλη αναζήτηση μπορείτε να κάνετε, εκτός στην περίπτωση αυτή 544 00:31:10,870 --> 00:31:15,730 είμαστε κατάταξη των στοιχείων από stackscore, το οποίο σας δίνει 545 00:31:15,730 --> 00:31:19,850 κάποια ιδέα για το πόσο δημοφιλείς είναι αυτές στοιχεία ήταν εντός της κοινότητας. 546 00:31:19,850 --> 00:31:25,610 Και έτσι με σαφήνεια, Αλίκη στη Χώρα των Θαυμάτων από την Walt Disney είναι εξαιρετικά δημοφιλής. 547 00:31:25,610 --> 00:31:36,570 Αλλά μπορείτε επίσης να δείτε στην τετράδα εδώ είναι αυτά που μπορεί να μην actually-- 548 00:31:36,570 --> 00:31:39,220 >> Πράγματα που χρησιμοποιείται πολύ, αλλά δεν μπορείτε αμέσως 549 00:31:39,220 --> 00:31:41,240 συνδεθεί με την Αλίκη στη Χώρα των Θαυμάτων. 550 00:31:41,240 --> 00:31:44,650 Έτσι, ο παλιός μας φίλος Ο Σχολιασμένη Alice είναι εδώ. 551 00:31:44,650 --> 00:31:46,350 Έτσι μπορώ να ρίξουμε μια ματιά σε αυτό. 552 00:31:46,350 --> 00:31:52,010 Και τώρα τι ψάχνω στο είναι βασικά ένα σύνολο of-- 553 00:31:52,010 --> 00:31:53,760 Μπορώ να έχω τη σχολιασμένη Αλίκη εδώ. 554 00:31:53,760 --> 00:31:56,700 Έχω πληροφορίες σχετικά με αυτό. 555 00:31:56,700 --> 00:32:00,230 Και έχω επίσης μια stackscore του, στην περίπτωση αυτή, 26. 556 00:32:00,230 --> 00:32:03,169 Και αυτό μου λέει είδος περίπου πώς φτάσαμε σε αυτό το stackscore, 557 00:32:03,169 --> 00:32:05,835 όπως το ποιος θα ελεγχθεί, όπως το πώς πολλές φορές είχε ελεγχθεί, 558 00:32:05,835 --> 00:32:08,440 όπως σχολή ή προπτυχιακούς, πώς πολλά αντίγραφα η βιβλιοθήκη έχει, 559 00:32:08,440 --> 00:32:11,300 και ούτω καθεξής και ούτω καθεξής. 560 00:32:11,300 --> 00:32:16,460 >> Και μπορείτε επίσης, αρκετά ενδιαφέροντα εδώ, αναζητήστε τις στοίβες ουσιαστικά. 561 00:32:16,460 --> 00:32:19,550 Έτσι ώστε τα δεδομένα εδώ, αυτό σας δείχνει το είδος 562 00:32:19,550 --> 00:32:23,547 από μία εικονική αναπαράσταση από ό, τι τη δύναμη ράφι 563 00:32:23,547 --> 00:32:25,880 μοιάζουν εάν επρόκειτο να λάβει το σύνολο των συμμετοχών της βιβλιοθήκης 564 00:32:25,880 --> 00:32:28,940 και να τα βάλει μαζί σε μια άπειρη ράφι. 565 00:32:28,940 --> 00:32:30,990 Και το ωραίο είναι ότι εμείς can-- 566 00:32:30,990 --> 00:32:33,380 >> Πρώτα απ 'όλα, το μεταδεδομένα για αυτά τα βιβλία 567 00:32:33,380 --> 00:32:35,627 συχνά σας λέει όταν δημοσιεύθηκε. 568 00:32:35,627 --> 00:32:37,085 Θα σας λέει πόσες σελίδες έχει. 569 00:32:37,085 --> 00:32:38,459 Θα μπορούσε να σας πω τις διαστάσεις. 570 00:32:38,459 --> 00:32:42,930 Έτσι, μπορείτε να δείτε ότι αντικατοπτρίζεται εδώ από την άποψη του μεγέθους των βιβλίων. 571 00:32:42,930 --> 00:32:46,740 >> Και τότε μπορούμε να χρησιμοποιήσουμε το στοίβα σκορ να τονίσει 572 00:32:46,740 --> 00:32:49,170 τα βιβλία που έχουν υψηλότερες βαθμολογίες στοίβα. 573 00:32:49,170 --> 00:32:54,930 Έτσι, αν είναι πιο σκούρα, αυτό σημαίνει ότι, προφανώς, χρησιμοποιείται πιο συχνά. 574 00:32:54,930 --> 00:32:57,040 Έτσι, σε αυτή την περίπτωση, είμαι πρόκειται να μαντέψει ότι αυτό 575 00:32:57,040 --> 00:33:03,226 είναι η έκδοση της Αλίκης στη Χώρα των Θαυμάτων ότι χρησιμοποιείται πολύ συχνά και πιο 576 00:33:03,226 --> 00:33:05,100 πρόσβαση, η βιβλιοθήκη έχει τα περισσότερα αντίγραφα. 577 00:33:05,100 --> 00:33:06,975 Έτσι, αν ψάχνετε για την Αλίκη στη χώρα των θαυμάτων, 578 00:33:06,975 --> 00:33:10,220 Αυτό θα μπορούσε να είναι ένα καλό μέρος για να ξεκινήσετε. 579 00:33:10,220 --> 00:33:13,500 >> Και τότε εδώ μπορείτε επίσης να συνδέσετε έξω για, ας πούμε, η Amazon να αγοράσουν το βιβλίο, 580 00:33:13,500 --> 00:33:15,182 και ούτω καθεξής και ούτω καθεξής. 581 00:33:15,182 --> 00:33:17,140 Το σημείο εδώ, και πάλι, δεν είναι τόσο πολύ ώστε αυτό 582 00:33:17,140 --> 00:33:25,030 είναι ο καλύτερος τρόπος για να περιηγηθείτε στη βιβλιοθήκη ή το κατάλληλο εργαλείο για κάθε περίσταση. 583 00:33:25,030 --> 00:33:28,400 Αλλά είναι ένας άλλος τρόπος για να γίνει αυτό. 584 00:33:28,400 --> 00:33:31,359 Και κάνοντας τα δεδομένα διαθέσιμες μέσω ενός API, το οποίο 585 00:33:31,359 --> 00:33:34,650 γίνεται πολύ απλά δομικά στοιχεία, που σας επιτρέπει να κάνετε αναζήτηση στο περιεχόμενο, 586 00:33:34,650 --> 00:33:39,420 μπορείτε να δημιουργήσετε κάτι όπως αυτό που μπορεί 587 00:33:39,420 --> 00:33:41,520 είναι εξαιρετικά πολύτιμο για μερικούς ανθρώπους. 588 00:33:41,520 --> 00:33:46,640 589 00:33:46,640 --> 00:33:51,860 >> Έτσι, αυτό είναι το είδος του, όσο θέλω να πω πραγματικά τι το API είναι 590 00:33:51,860 --> 00:33:56,070 και τι εκθέτει, υπάρχει ένα ολόκληρο σωρό πράγματα πίσω από τις σκηνές, η οποία 591 00:33:56,070 --> 00:33:59,480 Είμαι ακριβώς πρόκειται να αναφερθώ σε συντομία μόνο και μόνο επειδή αυτό το είδος του έρχεται σε αυτό 592 00:33:59,480 --> 00:34:03,720 από μια εντελώς διαφορετική γωνία την άποψη του πώς κάνει κάτι σαν αυτό 593 00:34:03,720 --> 00:34:04,580 να τεθεί σε εφαρμογή; 594 00:34:04,580 --> 00:34:10,820 >> Έτσι, ένα API είναι ένα πρότυπο διεπαφή με όλο αυτό το περιεχόμενο. 595 00:34:10,820 --> 00:34:13,820 Αλλά για να φτάσουμε εκεί, η το πρώτο πράγμα που έπρεπε να κάνουμε 596 00:34:13,820 --> 00:34:17,260 είχε τραβήξει μαζί πληροφοριών βιβλία και εικόνες 597 00:34:17,260 --> 00:34:21,580 και τα εργαλεία έρευνας, η συλλογή έγγραφο από διάφορα συστήματα του Χάρβαρντ. 598 00:34:21,580 --> 00:34:23,929 Aleph, VIA, και το OASIS είναι τα ονόματα των συστημάτων. 599 00:34:23,929 --> 00:34:28,820 Και πάνε κατ 'ουσίαν, σε μια αγωγός, αγωγός επεξεργασίας. 600 00:34:28,820 --> 00:34:33,230 >> Έτσι, πρώτα απ 'όλα, έχουμε την εξαγωγή αρχεία από όλα αυτά τα συστήματα. 601 00:34:33,230 --> 00:34:35,130 Εμείς τους χωρίσει σε επιμέρους αντικείμενα. 602 00:34:35,130 --> 00:34:39,360 Έτσι έχουμε ένα αρχείο, το οποίο είναι ένα gigabyte, η οποία έχει ένα εκατομμύρια δίσκους σε αυτό. 603 00:34:39,360 --> 00:34:42,290 Γι 'αυτό το χωρίσει σε επιμέρους αντικείμενα. 604 00:34:42,290 --> 00:34:45,374 Στη συνέχεια, για κάθε είδος, θα το μετατρέψει σε MODS, επειδή ορισμένες από αυτές 605 00:34:45,374 --> 00:34:47,040 είναι εγγενώς MODS, κάποια από αυτά δεν είναι. 606 00:34:47,040 --> 00:34:49,204 Έτσι παίρνουμε όλα να να είναι στην ίδια μορφή. 607 00:34:49,204 --> 00:34:51,120 Στη συνέχεια, υπάρχουν διάφορες εμπλουτισμού βήματα, όπου 608 00:34:51,120 --> 00:34:55,969 προσθέτουμε περισσότερες πληροφορίες στα δεδομένα ό, τι ήταν διαθέσιμο στη βιβλιοθήκη. 609 00:34:55,969 --> 00:34:59,750 Πρέπει, λοιπόν, να προσθέσουμε, πρώτα απ 'όλα έχουμε ό, τι βιβλιοθήκες που κατέχουν. 610 00:34:59,750 --> 00:35:02,250 Περνάμε μέσα από μια βήμα υπολογισμό του stackscore. 611 00:35:02,250 --> 00:35:07,112 Περνάμε μέσα από ένα άλλο στάδιο προσθήκη περισσότερων μεταδεδομένων από την άποψη 612 00:35:07,112 --> 00:35:10,730 από ό, τι οι άνθρωποι συλλογές θα μπορούσε να προστεθεί this-- 613 00:35:10,730 --> 00:35:12,532 >> Οι άνθρωποι δημιουργούν συλλογές αντικειμένων. 614 00:35:12,532 --> 00:35:13,990 Τι συλλογές δεν ανήκει; 615 00:35:13,990 --> 00:35:17,220 Πώς οι άνθρωποι με ετικέτα αυτό το περιεχόμενο στο παρελθόν; 616 00:35:17,220 --> 00:35:20,750 Στη συνέχεια, μπορείτε να φιλτράρετε έξω, και θα περιορίσει τα αρχεία, επειδή, όπως ανέφερα, 617 00:35:20,750 --> 00:35:24,120 υπάρχει κάποια αρχεία τα οποία, λόγω της λόγους πνευματικών δικαιωμάτων, δεν μπορούμε να μην εμφανίζεται. 618 00:35:24,120 --> 00:35:26,700 Και τότε θα τους φορτώσει σε κάτι που ονομάζεται 619 00:35:26,700 --> 00:35:31,680 Solr, το οποίο δεν είναι ένα ορθογραφικό λάθος, αλλά είναι το όνομα του ένα κομμάτι του λογισμικού 620 00:35:31,680 --> 00:35:35,710 ότι κάνει αναζήτηση ευρετηρίου, το οποίο κινεί όλη την αναζήτηση πίσω από το API. 621 00:35:35,710 --> 00:35:40,110 Και τότε γίνεται διαθέσιμη σε Το API, και οι άνθρωποι μπορούν να το χρησιμοποιήσουν. 622 00:35:40,110 --> 00:35:44,640 >> Έτσι, αυτό είναι σαν ένα αρκετά απλή διαδικασία. 623 00:35:44,640 --> 00:35:47,230 Ένα από τα ενδιαφέροντα τα πράγματα γι 'αυτό είναι 624 00:35:47,230 --> 00:35:50,990 ότι έχουμε να κάνουμε με 13 εκατομμύρια εγγραφές 625 00:35:50,990 --> 00:35:53,820 και θέλουμε να κάνουμε ή περισσότερο. 626 00:35:53,820 --> 00:36:01,260 Και θέλουμε να είναι σε θέση να χειριστεί αυτά σε μια σχετικά ταχεία τρόπο. 627 00:36:01,260 --> 00:36:03,630 Παίρνει πολύ χρόνο για να επεξεργάζεται 13 εκατομμύρια εγγραφές. 628 00:36:03,630 --> 00:36:09,529 >> Πώς, λοιπόν, αυτός ο αγωγός είναι που έχει συσταθεί είναι ότι μπορείτε can-- 629 00:36:09,529 --> 00:36:12,070 Υποθέτω ότι το πλεονέκτημα του αγωγού, το πρόβλημα που είμαστε 630 00:36:12,070 --> 00:36:15,580 προσπαθεί να λύσει εδώ, είναι ότι όλοι οι μετασχηματισμοί, όλα 631 00:36:15,580 --> 00:36:18,729 αυτά τα βήματα σε αυτό αγωγού είναι να διαχωριστούν. 632 00:36:18,729 --> 00:36:19,645 Δεν υπάρχει καμία εξάρτηση. 633 00:36:19,645 --> 00:36:22,146 Αν είστε επεξεργασία ένα ρεκόρ του ενός βιβλίου, 634 00:36:22,146 --> 00:36:24,270 δεν υπάρχει εξάρτηση σε ότι μεταξύ ένα άλλο βιβλίο. 635 00:36:24,270 --> 00:36:27,760 >> Έτσι, αυτό που μπορούμε να κάνουμε είναι βασικά, σε κάθε στάδιο του αγωγού, 636 00:36:27,760 --> 00:36:30,470 το βάζουμε σε μια ουρά στο σύννεφο. 637 00:36:30,470 --> 00:36:32,250 Έτυχε να είμαι στο Amazon Web Services. 638 00:36:32,250 --> 00:36:35,140 Έτσι, υπάρχει μια λίστα, λένε, 10.000 αντικείμενα που 639 00:36:35,140 --> 00:36:38,100 Πρέπει να εξομαλυνθεί και μετατρέπονται σε μορφή MODS. 640 00:36:38,100 --> 00:36:41,620 Και εμείς γυρίσει όπως πολλοί διακομιστές όπως θέλουμε, ίσως και 10 διακομιστές. 641 00:36:41,620 --> 00:36:44,860 Και κάθε ένα από αυτούς τους διακομιστές μόνο κάθεται εκεί, φαίνεται στο ότι ουρά, 642 00:36:44,860 --> 00:36:46,730 βλέπει ότι υπάρχει ένα που πρέπει να να υποβάλλονται σε επεξεργασία, τραβά μακριά ουρά, 643 00:36:46,730 --> 00:36:48,740 επεξεργάζεται και μπαστούνια αυτό στην επόμενη ουρά. 644 00:36:48,740 --> 00:36:54,200 >> Και έτσι αυτό που μας επιτρέπει ότι να κάνουμε είναι να εφαρμόσει, κατ 'ουσίαν, 645 00:36:54,200 --> 00:36:58,110 όσο υλικό όπως θέλουμε σε αυτό πρόβλημα για ένα πολύ σύντομο χρονικό διάστημα 646 00:36:58,110 --> 00:37:02,970 να επεξεργάζεται τα δεδομένα, το συντομότερο είναι δυνατόν, κάτι που μόνο, 647 00:37:02,970 --> 00:37:08,220 τώρα στον κόσμο του cloud computing μπορούμε διακομιστές διάταξη κατ 'ουσίαν 648 00:37:08,220 --> 00:37:09,890 ακαριαία, είναι ότι χρήσιμο. 649 00:37:09,890 --> 00:37:12,260 Γι 'αυτό και δεν χρειάζεται να έχουν μια Server γίγαντας κάθονται γύρω 650 00:37:12,260 --> 00:37:16,700 όλη την ώρα για να κάνει την επεξεργασία ότι μπορεί να συμβεί μόνο μία φορά την εβδομάδα. 651 00:37:16,700 --> 00:37:21,440 >> Έτσι ώστε να είναι ως επί το πλείστον. 652 00:37:21,440 --> 00:37:27,590 Δεν υπάρχει διαθέσιμη τεκμηρίωση για το στοιχείο API Βιβλιοθήκη Cloud 653 00:37:27,590 --> 00:37:31,960 σε αυτό το URL, το οποίο θα είναι διαθέσιμη αργότερα. 654 00:37:31,960 --> 00:37:36,730 Και παρακαλώ πηγαίνετε να ρίξετε μια ματιά για να δούμε αν υπάρχει κάτι, 655 00:37:36,730 --> 00:37:37,579 Έχετε κάποιες ιδέες. 656 00:37:37,579 --> 00:37:38,120 Παίξτε με αυτό. 657 00:37:38,120 --> 00:37:38,830 Ανόητος γύρω. 658 00:37:38,830 --> 00:37:42,800 Και ελπίζουμε ότι μπορείτε να έρθετε με κάτι μεγάλο. 659 00:37:42,800 --> 00:37:44,740 Σας ευχαριστώ. 660 00:37:44,740 --> 00:37:45,899