1 00:00:00,000 --> 00:00:11,370 2 00:00:11,370 --> 00:00:12,370 ג'פרי ליכט: היי. 3 00:00:12,370 --> 00:00:13,550 אני ג'פרי ליכט. 4 00:00:13,550 --> 00:00:17,890 ואני כאן כדי לדבר איתך על ספריית אוניברסיטת הרווארד ובנייה של מחר 5 00:00:17,890 --> 00:00:20,870 היום ספרייה, אני מניח. 6 00:00:20,870 --> 00:00:23,040 אז הרקע כאן, את המגרש לפגישה זו 7 00:00:23,040 --> 00:00:26,930 הוא למעשה שיש הרבה נתונים ביבליוגרפיים 8 00:00:26,930 --> 00:00:28,400 זמין בספריות של אוניברסיטת הרווארד. 9 00:00:28,400 --> 00:00:33,434 ויש הזדמנות, באמצעות כמה הכלים 10 00:00:33,434 --> 00:00:36,350 ופרויקט שהוא בשלבי פיתוח, כדי לקבל גישה למידע 11 00:00:36,350 --> 00:00:42,430 ולקחת אותו למקומות ש ספריית אוניברסיטת הרווארד לא עושה עכשיו, 12 00:00:42,430 --> 00:00:45,460 לעשות דברים חדשים עם זה, ניסוי ולשחק עם זה. 13 00:00:45,460 --> 00:00:52,413 >> אז נקודת הכניסה לתוך זה הוא API נקרא הרווארד הספרייה Cloud, ש 14 00:00:52,413 --> 00:00:57,650 הוא שרת metadata פתוח, שאני אדבר על עכשיו. 15 00:00:57,650 --> 00:01:02,595 אז הרקע הוא שיש הרבה דברים בספרייה של אוניברסיטת הרווארד. 16 00:01:02,595 --> 00:01:07,150 יש לנו מעל 13 מ'ביבליוגרפי רשומות, מיליונים תמונות, 17 00:01:07,150 --> 00:01:11,090 ואלפי עזרי מציאת, ש הם בעצם מסמכים המתארים 18 00:01:11,090 --> 00:01:15,500 אוספים, אומרים את מה ש הוא בהם, קופסות מסמכים 19 00:01:15,500 --> 00:01:21,080 וכן הלאה, שמייצגים מעל מיליון מסמכים בודדים. 20 00:01:21,080 --> 00:01:24,290 ויש גם הרבה מידע שיש בספרייה 21 00:01:24,290 --> 00:01:28,180 על איך התוכן משמש ש יכול להיות עניין של אנשים 22 00:01:28,180 --> 00:01:32,400 שאולי כדאי לך לעבוד עם זה. 23 00:01:32,400 --> 00:01:36,150 >> אז את כל המידע יש הספרייה מטה. 24 00:01:36,150 --> 00:01:39,500 אז metadata הוא נתונים על נתונים. 25 00:01:39,500 --> 00:01:42,070 לכן, כאשר אנחנו מדברים על המידע זה 26 00:01:42,070 --> 00:01:44,890 זמין דרך הספרייה ענן זה זמין, 27 00:01:44,890 --> 00:01:47,760 זה לא בהכרח המסמכים בפועל 28 00:01:47,760 --> 00:01:53,060 את עצמם, לא בהכרח מלאים טקסט של ספרים או תמונות מלאים, 29 00:01:53,060 --> 00:01:54,890 למרות שלמעשה יכול להיות במקרה. 30 00:01:54,890 --> 00:01:57,550 אבל זה באמת מידע על הנתונים. 31 00:01:57,550 --> 00:02:00,909 >> אז אתה יכול לחשוב על קיטלוג מידע, שיחת מספרים, נושאים, 32 00:02:00,909 --> 00:02:02,700 כמה עותקים של ספר יש, מה 33 00:02:02,700 --> 00:02:06,380 הם המהדורות, מה הם פורמטים, המחברים, וכן הלאה. 34 00:02:06,380 --> 00:02:12,250 אז יש הרבה מידע על המידע באוסף ש, 35 00:02:12,250 --> 00:02:14,400 בעצמו, הוא סוג של מטבע שימושי. 36 00:02:14,400 --> 00:02:19,230 ולמרות שאם אתה עושה מחקר המעמיק ב, 37 00:02:19,230 --> 00:02:25,160 ברור שאתה רוצה להגיע לבפועל תוכן עצמו ולהסתכל על הנתונים, 38 00:02:25,160 --> 00:02:30,140 מטה-נתונים הוא שימושיים במונחים של שניהם ניתוח קורפוס בכללותו, 39 00:02:30,140 --> 00:02:33,870 כמו מה דברים נמצאים באוסף. 40 00:02:33,870 --> 00:02:35,520 איך הם מתייחסים? 41 00:02:35,520 --> 00:02:39,482 זה עוזר לך באמת למצוא דברים אחרים, וזה באמת המטרה העיקרית שלו. 42 00:02:39,482 --> 00:02:41,190 הנקודה מטה-נתונים והקטלוג 43 00:02:41,190 --> 00:02:43,230 הוא לעזור לך למצוא את כל המידע זה 44 00:02:43,230 --> 00:02:46,590 זמין באוספים. 45 00:02:46,590 --> 00:02:53,690 >> אז זה הוא דוגמא של מטה עבור ספר בספרייה של אוניברסיטת הרווארד. 46 00:02:53,690 --> 00:02:56,370 אז זה שם. 47 00:02:56,370 --> 00:02:59,850 ואתה יכול לראות שזה למעשה מורכב בינוני. 48 00:02:59,850 --> 00:03:04,610 וחלק מהערך של מטה במערכת ספריית אוניברסיטת הרווארד 49 00:03:04,610 --> 00:03:09,320 הוא שזה היה סוג של נבנה על ידי מקטלג 50 00:03:09,320 --> 00:03:12,720 ונאסף על ידי אנשים פונים הרבה מומחיות ומיומנות 51 00:03:12,720 --> 00:03:20,030 וחשבתי לזה לאורך זמן, שבו יש הרבה ערך. 52 00:03:20,030 --> 00:03:25,450 >> אז אם אתה תסתכל על האלבום הזה ל המוער אליס, אתה יכול לגלות 53 00:03:25,450 --> 00:03:32,590 יש לך את הכותרת, שכתב אותו, המחבר, וכל נושאים השונים 54 00:03:32,590 --> 00:03:35,380 שאנשים קטלגו אותו ל. 55 00:03:35,380 --> 00:03:40,110 ואתה יכול לראות שיש גם, ב בנוסף להרבה מידע טוב 56 00:03:40,110 --> 00:03:42,852 כאן, יש כמה כפילויות. 57 00:03:42,852 --> 00:03:45,560 יש הרבה מורכבות זה בא לידי ביטוי באמצעות מטה 58 00:03:45,560 --> 00:03:46,300 שיש לך. 59 00:03:46,300 --> 00:03:50,320 >> אז כותרת אחד של ספר זה היא הרפתקאות אליס בארץ הפלאות. 60 00:03:50,320 --> 00:03:53,880 אז זה מוער גרסה של ספר זה. 61 00:03:53,880 --> 00:03:56,380 אבל זה גם נקרא מוער אליס, הרפתקאות אליס 62 00:03:56,380 --> 00:03:58,570 בארץ הפלאות, כי זה משהו ש 63 00:03:58,570 --> 00:04:00,430 מרטין גרדנר כתב ומבואר בספר. 64 00:04:00,430 --> 00:04:03,369 ויש הרבה מאוד מידע על חידות היגיון ודברים 65 00:04:03,369 --> 00:04:05,410 בתוך אליס ש כנראה לא ידע על. 66 00:04:05,410 --> 00:04:07,000 אז אתה צריך ללכת לקרוא אותו. 67 00:04:07,000 --> 00:04:11,940 >> אבל אתה יכול לראות שיש הרבה פרטים כאן, 68 00:04:11,940 --> 00:04:15,340 כולל מזהים, כאשר הוא נוצר, מאיפה זה בא, 69 00:04:15,340 --> 00:04:17,420 במונחים של הרווארד מערכת, וכן הלאה. 70 00:04:17,420 --> 00:04:20,350 אז זה מדגם של הסוג של מטה 71 00:04:20,350 --> 00:04:24,340 שאולי אתה רואה לספר ב אוסף הספרייה של אוניברסיטת הרווארד. 72 00:04:24,340 --> 00:04:26,680 >> זה משהו אחר לגמרי. 73 00:04:26,680 --> 00:04:32,610 אז יש מערכת בשם VIA הרווארד, אשר בעצם 74 00:04:32,610 --> 00:04:39,990 הוא מקטלג תמונות וחפצי אמנות ודברים חזותיים לאורך הרווארד, 75 00:04:39,990 --> 00:04:44,010 והוספתי כמה metadata להם, סיווגם, 76 00:04:44,010 --> 00:04:49,200 ו, במקרים מסוימים, מתן תמונות ממוזערות קטנות 77 00:04:49,200 --> 00:04:51,250 כי אתה יכול לקחת מסתכל אם אתה כל כך רוצה. 78 00:04:51,250 --> 00:04:54,240 >> אז זה הוא דוגמא ל מטה-נתונים שיש לך לצלחת 79 00:04:54,240 --> 00:04:57,840 מ, ככל הנראה, אליס בארץ הפלאות. 80 00:04:57,840 --> 00:05:00,499 ואתה יכול לראות שיש פחות metadata כאן. 81 00:05:00,499 --> 00:05:02,040 זה פשוט סוג של אובייקט אחר. 82 00:05:02,040 --> 00:05:03,425 וכך יש פחות מידע. 83 00:05:03,425 --> 00:05:07,790 >> יש לך בעיקר את העובדה ש, שיחה מספר, המהות שיצר אותו, - 84 00:05:07,790 --> 00:05:10,410 >> אנחנו לא יודעים מתי הוא נוצר. 85 00:05:10,410 --> 00:05:13,320 >> --and כותרת. 86 00:05:13,320 --> 00:05:14,300 >> דוגמא נוספת. 87 00:05:14,300 --> 00:05:16,380 זהו סיוע ממצא. 88 00:05:16,380 --> 00:05:19,030 אז יש אוסף של לואיס הניירות של קרול באוניברסיטת הרווארד. 89 00:05:19,030 --> 00:05:23,601 אז זה מתאר את מה ש באוסף זה. 90 00:05:23,601 --> 00:05:26,100 אז מישהו עבר ו הסתכל דרך כל התיבות 91 00:05:26,100 --> 00:05:32,220 ותקטלג אותו, נתן קצת רקע, נכתב סיכום של מה כאן. 92 00:05:32,220 --> 00:05:35,290 ואם היית מסתכל נוסף בשלב זה, זה 93 00:05:35,290 --> 00:05:39,620 ממשיך לעמודים על גבי עמודים ודפים, אבל יגידו לך 94 00:05:39,620 --> 00:05:41,860 מה אותיות ומה תאריכים ממה תיבות 95 00:05:41,860 --> 00:05:44,289 קיים בכל האוסף. 96 00:05:44,289 --> 00:05:46,330 אבל זה משהו ש כי, אם אתה באוניברסיטת הרווארד, 97 00:05:46,330 --> 00:05:50,720 אתה יכול ללכת וממש פיזי נראה ו, ככל הנראה, תסתכל. 98 00:05:50,720 --> 00:05:53,440 >> אז זה כל גדול. 99 00:05:53,440 --> 00:05:54,450 של מטה-נתונים שימושיים זה. 100 00:05:54,450 --> 00:05:56,327 זה במערכת ספריית אוניברסיטת הרווארד. 101 00:05:56,327 --> 00:05:58,910 ישנם כלים מקוונים שבו אתה יכול ללכת ותסתכל על זה, 102 00:05:58,910 --> 00:05:59,993 ורואה את זה, ולחפש אותו. 103 00:05:59,993 --> 00:06:02,810 ואתה יכול לחתוך אותו לקוביות זה בהרבה דרכים שונות. 104 00:06:02,810 --> 00:06:06,920 >> אבל זה ממש זמין רק אם אתה אדם לשבת 105 00:06:06,920 --> 00:06:12,600 בדפדפן האינטרנט שלך או משהו או הטלפון שלך ולנווט אותו. 106 00:06:12,600 --> 00:06:16,730 זה לא ממש זמין ב כל סוג של אופנה שמישה 107 00:06:16,730 --> 00:06:19,520 למערכות אחרות או מחשבים אחרים לשימוש, 108 00:06:19,520 --> 00:06:21,500 לא עם מערכות בתוך ספריית אוניברסיטת הרווארד, 109 00:06:21,500 --> 00:06:24,890 אבל מערכות בעולם שבחוץ, רק אנשים אחרים באופן כללי. 110 00:06:24,890 --> 00:06:30,210 אז השאלה היא, איך אנחנו יכולים להפוך אותו לזמין למחשבים 111 00:06:30,210 --> 00:06:33,560 כדי שנוכל לעשות יותר מעניין דברים עם זה מאשר רק 112 00:06:33,560 --> 00:06:36,550 גלישה זה בעצמנו? 113 00:06:36,550 --> 00:06:39,766 >> אז למה אתה רוצה לעשות את זה? 114 00:06:39,766 --> 00:06:41,140 יש הרבה אפשרויות. 115 00:06:41,140 --> 00:06:43,980 אחת מהן הוא שאתה יכול לבנות לחלוטין דרך של גלישה שונה 116 00:06:43,980 --> 00:06:46,962 התוכן זה זמין דרך הספריות של אוניברסיטת הרווארד. 117 00:06:46,962 --> 00:06:48,670 אני אראה לך אחד מאוחר יותר נקרא Stacklife, 118 00:06:48,670 --> 00:06:52,440 שבו יש שונה לחלוטין לקחת על מחפש תוכן. 119 00:06:52,440 --> 00:06:54,560 >> אתה יכול לבנות מנוע המלצה. 120 00:06:54,560 --> 00:06:57,955 אז ספריית אוניברסיטת הרווארד היא לא ב עסק של אומר, שאתה אוהב את הספר הזה. 121 00:06:57,955 --> 00:07:01,080 ואז ללכת תסתכל על 17 אחרים אלה ספרים שאתה עשוי להיות מעוניין ב 122 00:07:01,080 --> 00:07:03,200 או 18 תמונות אחרות אלה. 123 00:07:03,200 --> 00:07:06,040 אבל זה בהחלט יכול להיות תכונה רבת ערך. 124 00:07:06,040 --> 00:07:09,272 ובהתחשב במטה, רשאי הוא ניתן יהיה לשים את זה ביחד. 125 00:07:09,272 --> 00:07:11,980 אולי יש לך צרכי שונים ב מונחים של חיפוש התוכן, 126 00:07:11,980 --> 00:07:16,200 כמו אולי למרות הכלים ש זמינים שהספרייה עושה 127 00:07:16,200 --> 00:07:18,450 זמין, ייתכן שתרצה כדי לחפש בצורה שונה 128 00:07:18,450 --> 00:07:21,847 או לייעל למקרה לשימוש מסוים, שאולי זה מיוחד מאוד. 129 00:07:21,847 --> 00:07:23,930 אולי יש רק כמה אנשים בעולם ש 130 00:07:23,930 --> 00:07:25,846 רוצה לחפש התוכן בדרך זו, אבל זה 131 00:07:25,846 --> 00:07:28,985 יהיה נהדר אם יכל לתת להם לעשות את זה. 132 00:07:28,985 --> 00:07:30,860 יש הרבה ניתוחים בכמה אנשים 133 00:07:30,860 --> 00:07:33,860 להשתמש בתוכן שיהיה ממש מעניין לדעת עליהם, לגלות 134 00:07:33,860 --> 00:07:37,280 איזה ספרים נמצאים בשימוש, מה הם לא, וכן הלאה. 135 00:07:37,280 --> 00:07:41,670 ואז יש הרבה הזדמנות לשלב 136 00:07:41,670 --> 00:07:45,210 עם מידע אחר שיש שם בחוץ באינטרנט. 137 00:07:45,210 --> 00:07:46,880 אז אנחנו have-- 138 00:07:46,880 --> 00:07:50,260 >> לדוגמא, יש NPR קטע ביקורת על ספר, 139 00:07:50,260 --> 00:07:53,090 שבו הם לראיין מחברים על ספרים. 140 00:07:53,090 --> 00:07:56,837 וכך זה יהיה נהדר אם היית מחפש את ספר באוניברסיטת הרווארד 141 00:07:56,837 --> 00:07:59,670 ספרייה, ואתה אומר, בסדר, יש היה ראיון עם המחבר. 142 00:07:59,670 --> 00:08:00,878 בואו נלך תסתכל על זה. 143 00:08:00,878 --> 00:08:05,461 או שיש דף ויקיפדיה, כ התייחסות סמכותית, מחקרית 144 00:08:05,461 --> 00:08:07,710 על הספר הזה שאתה אולי כדאי לך להעיף מבט על. 145 00:08:07,710 --> 00:08:12,600 >> ישנם סוגים אלה של מקורות פזורים בכל רחבי האינטרנט. 146 00:08:12,600 --> 00:08:16,555 ולהביא אותם יחד יכול להיות שימוש רב 147 00:08:16,555 --> 00:08:18,930 למישהו מסתכל על תוכן, מחפש משהו. 148 00:08:18,930 --> 00:08:20,180 אבל זה גם לא מסוג הדברים שהיית 149 00:08:20,180 --> 00:08:23,205 רוצה הספרייה להיות אחראית ליורד ולצוד 150 00:08:23,205 --> 00:08:25,455 כל מקורות שונים אלה וחיבורם יחד 151 00:08:25,455 --> 00:08:28,920 בגלל שהם משתנים ללא הרף. 152 00:08:28,920 --> 00:08:33,570 ומה שהם חושבים הוא במאי החשוב לא מה שאתה חושב חשוב. 153 00:08:33,570 --> 00:08:36,929 >> ועוד יותר מכך, בעצם יש הרבה דברים שאנחנו לא חשבנו על עדיין. 154 00:08:36,929 --> 00:08:42,222 אז אם אנחנו יכולים לפתוח את זה, יותר אנשים מלבד חצי תריסר, 155 00:08:42,222 --> 00:08:45,174 שמסתכלים על זה ב בסיס קבוע יכול לחשוב על רעיונות 156 00:08:45,174 --> 00:08:47,340 ולעסות את הנתונים, ו לעשות מה שהם רוצים עם זה. 157 00:08:47,340 --> 00:08:49,920 158 00:08:49,920 --> 00:08:54,045 >> אז אנחנו רוצים לעשות את זה נתונים הקיימים בעולם. 159 00:08:54,045 --> 00:08:55,670 ובכן, יש כמה סיבוכים. 160 00:08:55,670 --> 00:08:58,540 אחת הוא שזה metadata הוא במערכות שונות. 161 00:08:58,540 --> 00:09:01,110 זה בפורמטים שונים. 162 00:09:01,110 --> 00:09:04,719 אז יש כמה נורמליזציה שצריך לקרות, 163 00:09:04,719 --> 00:09:08,010 שנורמליזציה להיות התהליך מביא דברים מפורמטים שונים 164 00:09:08,010 --> 00:09:12,940 ומיפוי אותם לפורמט אחד כך שהשדות יתאימו. 165 00:09:12,940 --> 00:09:15,160 >> יש כמה מגבלות של זכויות יוצרים. 166 00:09:15,160 --> 00:09:21,010 למרבה הפלא, כניסת הקטלוג על ספר הוא אחראי לזכויות יוצרים. 167 00:09:21,010 --> 00:09:24,060 אז למרות שזה רק מידע ההופק מהספר, 168 00:09:24,060 --> 00:09:25,330 זה copyrightable. 169 00:09:25,330 --> 00:09:28,400 ותלוי מי בעצם נוצר metadata ש, 170 00:09:28,400 --> 00:09:32,175 ייתכנו הגבלות על ש יכול להפיץ אותו, to-- דומה 171 00:09:32,175 --> 00:09:33,402 >> אֲנִי לֹא יוֹדֵעַ. 172 00:09:33,402 --> 00:09:36,110 זה יכול או לא יכול להיות דומה ל המצב של מילות השיר, 173 00:09:36,110 --> 00:09:36,610 לדוגמא. 174 00:09:36,610 --> 00:09:38,560 אז כולנו יודעים איך זה יצליח. 175 00:09:38,560 --> 00:09:40,450 אז אתה צריך לעקוף את הבעיה. 176 00:09:40,450 --> 00:09:44,910 >> ואז עוד חתיכה היא שיש הרבה נתונים. 177 00:09:44,910 --> 00:09:52,420 אז אם אני מישהו שרוצה לעבוד עם נתונים או שיש רעיון מגניב, 178 00:09:52,420 --> 00:09:55,350 התמודדות עם 14 מ' רשומות על המחשב הנייד שלי 179 00:09:55,350 --> 00:09:57,487 יכול להיות בעייתי וקשה לניהול. 180 00:09:57,487 --> 00:09:59,320 אז אנחנו רוצים להפחית המחסומים לאנשים 181 00:09:59,320 --> 00:10:02,130 להיות מסוגל לעבוד עם נתונים. 182 00:10:02,130 --> 00:10:07,880 >> אז הגישה בתקווה כי כתובות כל החששות האלה הוא שני חלקים. 183 00:10:07,880 --> 00:10:11,770 אחד בונה פלטפורמה שלוקחת נתונים מכל המקורות השונים אלה 184 00:10:11,770 --> 00:10:14,350 ומדרדר אותה, מנרמל, מעשיר אותו, והופך את 185 00:10:14,350 --> 00:10:16,650 זה זמין במקום אחד. 186 00:10:16,650 --> 00:10:20,950 והוא עושה את זה זמין דרך API ציבורי שאנשים יכולים לקרוא. 187 00:10:20,950 --> 00:10:24,430 >> אז API הוא יישום ממשק תכנות. 188 00:10:24,430 --> 00:10:28,930 וזה בעצם מתייחס ל נקודת סיום שמערכת או טכנולוגיה 189 00:10:28,930 --> 00:10:31,720 יכול להתקשר ולקבל נתונים בחזרה ב פורמט מובנה בדרך 190 00:10:31,720 --> 00:10:32,900 שניתן להשתמש בו. 191 00:10:32,900 --> 00:10:36,060 אז זה לא תלוי על מעבר לאתר אינטרנט 192 00:10:36,060 --> 00:10:37,970 ומגרד את הנתונים שלו, למשל. 193 00:10:37,970 --> 00:10:40,690 194 00:10:40,690 --> 00:10:45,010 >> אז זה בדף הבית של API פריט ספריית הענן, 195 00:10:45,010 --> 00:10:47,220 שהוא בעצם הגרסה שלה לשתיים. 196 00:10:47,220 --> 00:10:50,130 אז זה החזרה השניה של מנסה להפוך את כל הנתונים הללו 197 00:10:50,130 --> 00:10:53,280 זמין לעולם. 198 00:10:53,280 --> 00:10:59,560 אז זה http://api.lib.harvard.edu/v2/items. 199 00:10:59,560 --> 00:11:03,830 ורק כדי לשבור את זה קצת, מה זה אומר 200 00:11:03,830 --> 00:11:06,115 הוא שזה גרסה של שתי API. 201 00:11:06,115 --> 00:11:08,490 יש גרסה אחת, ש אני לא הולך לדבר עליו. 202 00:11:08,490 --> 00:11:09,750 אבל יש גרסה אחת. 203 00:11:09,750 --> 00:11:14,740 >> ואם אתה קורא את זה API, אתה מקבל פריטים. 204 00:11:14,740 --> 00:11:20,640 וחלק מהרעיון של API הוא ה- API הוא חוזה. 205 00:11:20,640 --> 00:11:23,440 זה משהו שהוא לא הולך להשתנות. 206 00:11:23,440 --> 00:11:24,850 כך למשל, - 207 00:11:24,850 --> 00:11:27,410 >> והסיבה לכך היא שאם אני לבנות איזה מערכת ש 208 00:11:27,410 --> 00:11:33,210 הוא הולך להשתמש API ענן ספרייה להצגת ספרים או לעזור לאנשים למצוא 209 00:11:33,210 --> 00:11:36,190 מידע בדרכים ייחודיות, מה שאנחנו לא רוצים שנקרה 210 00:11:36,190 --> 00:11:38,940 הוא לנו ללכת לשנות את אופן ש API זה עובד, ופתאום 211 00:11:38,940 --> 00:11:41,340 כל מה ששובר בצד משתמש קצה. 212 00:11:41,340 --> 00:11:46,710 אז חלק מאם אתה עושה API זמין לעולם, זה 213 00:11:46,710 --> 00:11:49,396 תרגול טוב לשים מספר גרסה בזה כדי שאנשים 214 00:11:49,396 --> 00:11:51,020 יודע עם איזו גרסה שהם עוסקים. 215 00:11:51,020 --> 00:11:54,300 >> אז אם אנחנו מחליטים שאנו מוצאים דרך טובה יותר של הפיכת מידע זה זמין, 216 00:11:54,300 --> 00:11:57,295 אנו עשויים לשנות את זה ל קורא גרסה כי שלוש. 217 00:11:57,295 --> 00:11:59,920 אז כל מי שעדיין משתמשים ב גרסה שתי, שעדיין עובדים. 218 00:11:59,920 --> 00:12:03,490 אבל שלוש היית גרסה יש את כל הדברים החדשים. 219 00:12:03,490 --> 00:12:06,680 220 00:12:06,680 --> 00:12:09,210 >> אז זה API, אבל זה באמת נראה כמו כתובת אתר. 221 00:12:09,210 --> 00:12:11,680 ואז מה זה דוגמא היא מה 222 00:12:11,680 --> 00:12:16,615 נקרא API שאר, אשר זמינות מעל רק באינטרנט חיבור רגיל. 223 00:12:16,615 --> 00:12:19,680 ואתה באמת יכול ללכת אליו בדפדפן. 224 00:12:19,680 --> 00:12:28,550 >> אז הנה אני עתה נפתחתי בפיירפוקס ו הלכתי לapi.lib.harvard.edu/v2/items. 225 00:12:28,550 --> 00:12:31,560 ואז מה שאני מקבל כאן הוא בעצם העמוד הראשון 226 00:12:31,560 --> 00:12:34,740 תוצאות מכל קבוצה של פריטים שיש לנו. 227 00:12:34,740 --> 00:12:37,460 וזה כאן בפורמט XML. 228 00:12:37,460 --> 00:12:40,130 229 00:12:40,130 --> 00:12:42,210 וזה גם היה להתייפייף על ידי פיירפוקס. 230 00:12:42,210 --> 00:12:45,850 זה לא באמת צריך את כל אלה מתרחב ומתכווץ קטנים 231 00:12:45,850 --> 00:12:47,880 doohickeys כאן. 232 00:12:47,880 --> 00:12:52,520 זה סוג של נחמד גרסת דרך להסתכל על זה. 233 00:12:52,520 --> 00:12:57,040 >> אבל מה זה אומר לנו הוא אני כבר ביקשתי את כל הפריטים. 234 00:12:57,040 --> 00:13:03,120 אז יש 13289475 פריטים. 235 00:13:03,120 --> 00:13:06,150 ואני מסתכל על ראשון 10, החל משעת העמדה אפס 236 00:13:06,150 --> 00:13:09,760 כי במדעי מחשב אנחנו תמיד מתחילים באפס. 237 00:13:09,760 --> 00:13:15,150 ומה יש לי כאן, אם אני פשוט תקרוס זה, תראה שיש לי 10 פריטים. 238 00:13:15,150 --> 00:13:20,410 239 00:13:20,410 --> 00:13:25,210 >> ואם אני נסתכל על פריט, שאני יכול רואה שיש לי מידע על זה. 240 00:13:25,210 --> 00:13:27,400 וזה מה שנקרא בצורת MODS. 241 00:13:27,400 --> 00:13:30,860 ואז אני הולך לעבור אחזור לכאן לרגע. 242 00:13:30,860 --> 00:13:33,750 OK. 243 00:13:33,750 --> 00:13:37,447 >> אז בואו לחפש משהו ב ספציפי כיוון שהפריט הראשון ש 244 00:13:37,447 --> 00:13:40,030 קורה לבוא כאשר אתה מסתכל דרך האוסף כולו 245 00:13:40,030 --> 00:13:41,750 הוא, בהגדרה, אקראי. 246 00:13:41,750 --> 00:13:44,550 אז בואו נסתכל לכמה סופגניות. 247 00:13:44,550 --> 00:13:46,830 אה. 248 00:13:46,830 --> 00:13:49,190 >> OK. 249 00:13:49,190 --> 00:13:49,940 אז סופגניות. 250 00:13:49,940 --> 00:13:55,360 כך מצאנו שיש 80 פריטים ב האוסף הכולל הפניות לסופגניות. 251 00:13:55,360 --> 00:13:57,150 אנחנו מסתכלים על 10 הראשונים שלהם. 252 00:13:57,150 --> 00:14:01,890 עכשיו, אתם יכולים לראות כאן את הדרך שבי אמרתי שאני מחפש סופגניות, 253 00:14:01,890 --> 00:14:04,400 אני רק הוספתי משהו ל מחרוזת השאילתה של כתובת האתר. 254 00:14:04,400 --> 00:14:09,680 אז q שווה סופגניות, שבו אתה יכול לראות קצת יותר בקלות כאן. 255 00:14:09,680 --> 00:14:12,131 >> וזה בעצם אומר שיש מפרט לAPI, ש 256 00:14:12,131 --> 00:14:13,880 מגדיר מה כל פרמטרים אלה מתכוונים. 257 00:14:13,880 --> 00:14:17,150 וזה אומר שאנחנו הולכים לחפש כל דבר לסופגניות. 258 00:14:17,150 --> 00:14:24,910 >> אז את הפריט הראשון שיש לנו כאן אתה יכול לראות את הכותרת היא סופגניות, 259 00:14:24,910 --> 00:14:29,310 ויש כתוביות בשם פסיון אמריקאי, שהוא, אני מניח, 260 00:14:29,310 --> 00:14:31,610 מתאים. 261 00:14:31,610 --> 00:14:36,134 יש הרבה של different-- 262 00:14:36,134 --> 00:14:38,050 ברגע שאתה מגיע לנקודה לקבל את הנתונים, 263 00:14:38,050 --> 00:14:41,020 יש הרבה שונה פורמטים שאתה יכול לקבל אותו לתוך. 264 00:14:41,020 --> 00:14:44,050 ויש עוצמות שונות וחולשות של כולם. 265 00:14:44,050 --> 00:14:49,000 אז זה אחד, אתה יכול לראות כאן, בטופס זה הוא מאוד עשיר. 266 00:14:49,000 --> 00:14:51,946 וזה טופל. 267 00:14:51,946 --> 00:14:55,040 >> אז יש כותרת ספציפית שדה, שדה כתובית. 268 00:14:55,040 --> 00:14:58,950 יש חלופי כותרת, פסיון אמריקאי. 269 00:14:58,950 --> 00:15:01,650 יש שם ששויך לו. 270 00:15:01,650 --> 00:15:03,120 סוג של המשאב הוא טקסט. 271 00:15:03,120 --> 00:15:06,070 יש הרבה מידע כאן בפורמט זה. 272 00:15:06,070 --> 00:15:09,480 >> אבל יש חבורה פורמטים שונים של. 273 00:15:09,480 --> 00:15:11,920 אז מה היינו רק מסתכל עליו בפורמט 274 00:15:11,920 --> 00:15:17,700 MODS נקרא, אשר מייצג שירות תיאור אובייקט Metadata, 275 00:15:17,700 --> 00:15:18,250 פוטנציאל. 276 00:15:18,250 --> 00:15:23,030 אני בעצם לא ממש בטוח לגבי ס 'אבל זה פורמט מורכב למדי. 277 00:15:23,030 --> 00:15:24,240 זה פורמט ברירת המחדל. 278 00:15:24,240 --> 00:15:30,260 >> אבל זה אחד שמחזיק העושר של כל הנתונים 279 00:15:30,260 --> 00:15:33,820 שהספרייה יש משום זה קרוב מאוד למה ש 280 00:15:33,820 --> 00:15:35,110 הספרייה משתמשת באופן פנימי. 281 00:15:35,110 --> 00:15:39,030 זה סטנדרטי שהוא משמש בכל רחבי הארץ, 282 00:15:39,030 --> 00:15:40,944 ברחבי העולם בספריות אקדמיות. 283 00:15:40,944 --> 00:15:42,110 וזה מאוד יכולת פעולה הדדית. 284 00:15:42,110 --> 00:15:44,852 אז אם יש לך מסמך כי הוא בפורמט MODS, 285 00:15:44,852 --> 00:15:47,560 אתה יכול לתת את זה למישהו אחר מערכות שמבינות MODS, 286 00:15:47,560 --> 00:15:48,518 והם יכולים לייבא אותו. 287 00:15:48,518 --> 00:15:50,840 אז זה סטנדרטי. 288 00:15:50,840 --> 00:15:54,250 הוא מוגדר היטב, מאוד ספציפי. 289 00:15:54,250 --> 00:15:58,980 וזה מה שעושה את זה יכולת פעולה הדדית, כי אם מישהו אומר, 290 00:15:58,980 --> 00:16:04,930 זו הכותרת החלופית של שיא, כולם יודע מה זה אומר. 291 00:16:04,930 --> 00:16:07,740 מצד השני, זה מאוד מסובך. 292 00:16:07,740 --> 00:16:13,160 >> אז אם אתה תסתכל בתקליט הזה כאן, 293 00:16:13,160 --> 00:16:15,320 אם אני רק רוצה לקבל את כותרתו של מסמך זה, 294 00:16:15,320 --> 00:16:21,150 בספר זה, שהוא כנראה סופגניות, פסיון אמריקאי, ניתוח אותו 295 00:16:21,150 --> 00:16:22,940 הוא מעט מעורב. 296 00:16:22,940 --> 00:16:27,380 הואיל ויש עוד פורמט שנקרא Dublin Core, 297 00:16:27,380 --> 00:16:29,730 שהוא הרבה פורמט, הרבה יותר פשוט. 298 00:16:29,730 --> 00:16:33,764 >> ואז אתה רואה כאן, אין כותרת, כותרת משנה, כותרת חלופית. 299 00:16:33,764 --> 00:16:35,930 יש רק את הכותרת, סופגניות, פסיון אמריקאי, 300 00:16:35,930 --> 00:16:38,780 ועוד כותרת, פסיון אמריקאי. 301 00:16:38,780 --> 00:16:42,907 לכן, כאשר אתה מסתכל על מה טופס אתה רוצה לקבל את הנתונים מ, 302 00:16:42,907 --> 00:16:44,740 הרבה תלוי באופן ש אתה הולך להשתמש בו. 303 00:16:44,740 --> 00:16:46,573 האם אתה משתמש ל יכולת פעולה הדדית או שאתה 304 00:16:46,573 --> 00:16:49,970 רוצה משהו פשוט ש יכול להיות קל יותר לעבוד איתו? 305 00:16:49,970 --> 00:16:56,002 >> מצד השני, הרבה פרטים לקבל נמעכו את הסוג של. 306 00:16:56,002 --> 00:16:58,460 אתה עלול לאבד את הדקויות של מה אמצעי תחום מסוים 307 00:16:58,460 --> 00:17:02,960 עם Dublin Core אם יש לך עסק, שלא היית מקבל בMODS. 308 00:17:02,960 --> 00:17:06,462 אז אלה הם שני הפורמטים אתה יכול לצאת מAPI. 309 00:17:06,462 --> 00:17:08,920 ובעצם, אנחנו שומרים זה מאחורי הקלעים בMODS. 310 00:17:08,920 --> 00:17:14,179 אבל אנחנו יכולים לתת לך את זה בMODS ו Dublin Core וכל דבר אחר גם כן. 311 00:17:14,179 --> 00:17:16,470 השיקול האחר כש אתה מחפש בנתונים 312 00:17:16,470 --> 00:17:21,210 הוא שאתה יכול לקבל את זה כמו גם JSON, ש עומד לסימון אובייקט JavaScript, 313 00:17:21,210 --> 00:17:24,720 או XML, העומד ל Extensible Markup Language. 314 00:17:24,720 --> 00:17:30,080 וייצוגי נתונים אלה שני יש בדיוק את אותם נתונים, בדיוק 315 00:17:30,080 --> 00:17:31,080 אותו השדות. 316 00:17:31,080 --> 00:17:33,644 אבל הם פשוט שונה מבחינה תחבירית. 317 00:17:33,644 --> 00:17:40,401 >> אז זה a-- 318 00:17:40,401 --> 00:17:41,400 ובכן, בואו פשוט לעבור. 319 00:17:41,400 --> 00:17:47,490 אז זה השאילתה שלנו ל סופגניות בפורמט XML. 320 00:17:47,490 --> 00:17:53,470 אם אני רק לעבור את זה כדי להיות JSON, אני יכול לראות את זה נראה אחר. 321 00:17:53,470 --> 00:17:58,580 אז עכשיו זה אותו התוכן, אבל מבנה שונה. 322 00:17:58,580 --> 00:18:00,080 יש סוגריים זווית פחות. 323 00:18:00,080 --> 00:18:02,530 יש פחות מפורט. 324 00:18:02,530 --> 00:18:06,440 >> וזה פורמט ש, אם אתה עובדים בסביבת האינטרנט, 325 00:18:06,440 --> 00:18:09,680 אתה כנראה הולך לרוצה להשתמש כי אחד 326 00:18:09,680 --> 00:18:12,630 הדברים היפים על JSON הוא זה תואם עם JavaScript. 327 00:18:12,630 --> 00:18:17,680 אז אם אני כותב יישום אינטרנט, אני יכול למשוך בJSON צודק ולעבוד עם זה באופן ישיר. 328 00:18:17,680 --> 00:18:20,187 ואילו עם XML, זה קצת יותר מסובך. 329 00:18:20,187 --> 00:18:21,520 אז שוב, אלה שניהם שימושיים. 330 00:18:21,520 --> 00:18:26,387 הם פשוט מקרים שימוש שונים שבו אנשים אולי כדאי לך להשתמש בם. 331 00:18:26,387 --> 00:18:26,886 OK. 332 00:18:26,886 --> 00:18:29,810 333 00:18:29,810 --> 00:18:31,680 אז בחזרה לAPI. 334 00:18:31,680 --> 00:18:32,900 אז אנחנו יכולים לחפש for-- 335 00:18:32,900 --> 00:18:36,220 >> אני נותן דוגמא של מחפש סופגניות. 336 00:18:36,220 --> 00:18:39,330 אנחנו יכולים גם לחפש רק ב שדה מסוים בתוך כאן. 337 00:18:39,330 --> 00:18:41,310 אז במקום לחפש השיא כל, 338 00:18:41,310 --> 00:18:43,870 אני רק יכול לחפש את שדה הכותרת. 339 00:18:43,870 --> 00:18:48,810 ואז עכשיו יש 25 דברים ש יש סופגניות בכותרת, שאחד מהם 340 00:18:48,810 --> 00:18:52,430 הוא על שחזור ביצות בניהול 341 00:18:52,430 --> 00:18:54,990 של החור בסופגנייה תכנית, שהוא כנראה 342 00:18:54,990 --> 00:18:58,970 לא בהכרח מה שאנחנו מחפשים כאשר אנחנו מחפשים סופגניות. 343 00:18:58,970 --> 00:19:02,790 344 00:19:02,790 --> 00:19:05,490 >> גם אתה יכול, כשאתה התמודדות עם API-- 345 00:19:05,490 --> 00:19:08,827 >> חלק שיש API נותן לאנשי גישה לערכות נתונים גדולים. 346 00:19:08,827 --> 00:19:11,410 ויש כמה שונה כלים שאתה יכול להשתמש בו כדי לעשות את זה. 347 00:19:11,410 --> 00:19:14,170 אחת מהן הוא, מאוד פשוט, אתה יכול לדפדף בנתונים. 348 00:19:14,170 --> 00:19:17,340 אז בדיוק כמו שאם אתה עושה את שאילתא באמצעות ממשק אינטרנט, 349 00:19:17,340 --> 00:19:19,470 אתה יכול להסתכל בדף אחד, דף שני, עמוד שלוש. 350 00:19:19,470 --> 00:19:22,040 אתה יכול לעשות את אותו הדבר דבר באמצעות API. 351 00:19:22,040 --> 00:19:24,150 אתה רק צריך להיות מפורש באיך אתה עושה את זה. 352 00:19:24,150 --> 00:19:29,511 >> כך למשל, אם אני מחפש בשאילתה הראשונה שלי כאן, 353 00:19:29,511 --> 00:19:32,510 שבו אני עושה את חיפוש עבור דברים עם סופגניות בכותרת, אני יכול לומר, 354 00:19:32,510 --> 00:19:35,415 והגבול שווה 20, מה שאומר ש תן לי 20 הרשומות הראשון, לא 355 00:19:35,415 --> 00:19:38,540 10 הראשונים, שהוא ברירת המחדל, כי אני רוצה להסתכל על 20 בכל פעם. 356 00:19:38,540 --> 00:19:43,435 או שאני יכול לומר, שנקבע להתחיל השווה ל- 20 וגבול 357 00:19:43,435 --> 00:19:47,150 שווה 20, אשר ייתן לי שלי רושם 21 עד 40. 358 00:19:47,150 --> 00:19:52,680 >> אז אני מניח שהדבר לקחת כאן הוא 359 00:19:52,680 --> 00:19:57,290 שבו אנו משתמשים בחוטי השאילתה לפרמטרים שנקבע בשאילתה. 360 00:19:57,290 --> 00:20:02,760 וזה מאפשר לך שליטה מה שאתה מקבל בחזרה. 361 00:20:02,760 --> 00:20:05,980 >> כלי נוסף שניתן להשתמש בי, - 362 00:20:05,980 --> 00:20:09,250 >> וזה באמת מועיל ב מבחינת לחקור את הנתונים. 363 00:20:09,250 --> 00:20:10,840 >> --is משהו שנקרא faceting. 364 00:20:10,840 --> 00:20:15,530 אז faceting הטווח הוא לא בהכרח משותף. 365 00:20:15,530 --> 00:20:16,880 אבל שכולכם ראית את זה לפני. 366 00:20:16,880 --> 00:20:18,630 אם תסתכל אמזון, למשל, 367 00:20:18,630 --> 00:20:20,870 ואתה עושה את חיפוש עבור סופגניות בספרים, 368 00:20:20,870 --> 00:20:27,080 כאן יש להם סדרה של ספרים, והם מקובצים לפי קטגוריה, 369 00:20:27,080 --> 00:20:30,470 ואתה מקבל את הקטגוריות השונות, וכמה ספרים בכל קטגוריה 370 00:20:30,470 --> 00:20:31,330 להופיע. 371 00:20:31,330 --> 00:20:33,420 >> אז זה בעצם פן. 372 00:20:33,420 --> 00:20:37,570 אתה לוקח את כל הספרים שלהם, 1,800 ספרים התואמים את הסופגניות באמזון. 373 00:20:37,570 --> 00:20:39,820 12 מהם נמצאים ב קטגוריה ארוחת בוקר. 374 00:20:39,820 --> 00:20:43,100 21 בבצק ואפייה, וכן הלאה וכן הלאה. 375 00:20:43,100 --> 00:20:47,670 >> אז זה באמת שימושי כלי לחקר התוכן 376 00:20:47,670 --> 00:20:53,260 בתוך הספרייה, כמו גם כי כשאתה מסתכל על פן, 377 00:20:53,260 --> 00:20:56,520 זה נותן לך מושג על מה מכפיף קיים, כמו איזה סוג של נושאים 378 00:20:56,520 --> 00:20:58,510 הפופולריים ביותר בתוך סט השאילתה שלך. 379 00:20:58,510 --> 00:21:00,950 וזה עוזר לך נוסע ולחקור. 380 00:21:00,950 --> 00:21:02,770 אז אנחנו יכולים לעשות את אותו הדבר. 381 00:21:02,770 --> 00:21:05,940 >> אם אנחנו רוצים להשתמש ב API ומסתכלים על היבטים, 382 00:21:05,940 --> 00:21:08,950 אנו מוסיפים פרמטר נוסף ל ידידנו מחרוזת השאילתה. 383 00:21:08,950 --> 00:21:12,540 אז היבטים שווים מופרד בפסיקים רשימה של מה שאנחנו רוצים פן ב. 384 00:21:12,540 --> 00:21:14,790 אז אחת מההיבטים עשוי להיות כפוף. 385 00:21:14,790 --> 00:21:16,565 נוסף עשוי להיות שפה. 386 00:21:16,565 --> 00:21:19,665 ולכן אם אנחנו רצים שאילתא ש, אנחנו get-- 387 00:21:19,665 --> 00:21:23,372 388 00:21:23,372 --> 00:21:24,830 זה נראה פחות או יותר אותו הדבר כאן. 389 00:21:24,830 --> 00:21:29,010 אבל הוספנו לסוף רשימת סט של היבטים. 390 00:21:29,010 --> 00:21:34,060 אז יש לנו פן נקרא נושא. 391 00:21:34,060 --> 00:21:40,250 אז זה אומר לנו שאם אני מסתכל בגיל 80 את התוצאות שלי משאילתא הסופגנייה, 392 00:21:40,250 --> 00:21:42,100 13 מהם יש לי להכפיף את ארצות הברית. 393 00:21:42,100 --> 00:21:43,684 שלוש יש לי סופגניות הנושא. 394 00:21:43,684 --> 00:21:45,600 שלוש יש את הנושא של שיקום בתי גידול לח, 395 00:21:45,600 --> 00:21:47,720 אשר עשוי להיות החור שלנו בסופגנייה. 396 00:21:47,720 --> 00:21:51,780 שניים מהם, משפחת סימפסון, וכן הלאה וכן הלאה. 397 00:21:51,780 --> 00:21:59,211 >> אז זה יכול להיות שימושי אם אתה רוצה לצמצם את החיפוש שלך. 398 00:21:59,211 --> 00:22:00,210 זה יכול לעזור לך לעשות את זה. 399 00:22:00,210 --> 00:22:03,580 במיוחד אם יש לך יותר מאשר, למשל, 80 תוצאות. 400 00:22:03,580 --> 00:22:05,980 >> בדומה לכך, אנחנו גם ביקשנו להיבטים בשפה. 401 00:22:05,980 --> 00:22:14,790 אז אם אנחנו מסתכלים על התוצאות שלנו, אנו רואים 76 מהם נמצאים באנגלית, בצרפתית ארבע, 402 00:22:14,790 --> 00:22:19,620 שתי בספרדית, שתי, אני חושב שזה לא מוגדר או לא ידוע, הולנדי ולטיני. 403 00:22:19,620 --> 00:22:22,830 אז אני חושב לטיני תוצאת סופגנייה, שוב, 404 00:22:22,830 --> 00:22:24,922 יש מה לעשות עם דברי מאפה. 405 00:22:24,922 --> 00:22:25,630 אבל הנה לך. 406 00:22:25,630 --> 00:22:31,420 407 00:22:31,420 --> 00:22:38,630 >> אז זה סוג של מראה לך איך אתה יכול למשוך את התוכן חזרה 408 00:22:38,630 --> 00:22:41,270 מAPI רק דרך דפדפן אינטרנט, וזה נהדר. 409 00:22:41,270 --> 00:22:44,320 אבל זה לא באמת מה שהיית עושה בדרך כלל ישתמש בAPI לזה. 410 00:22:44,320 --> 00:22:48,710 אז דוגמא אחת לאופן שבי באמת יכול לעשות את זה הוא לי 411 00:22:48,710 --> 00:22:54,720 נכתבה תכנית סופר קטנה, אשר, שוב, עושה חיפוש הסופגנייה שלי 412 00:22:54,720 --> 00:22:59,010 ובוחר בני זוג שדות ומציג אותם בטבלה. 413 00:22:59,010 --> 00:23:01,610 אז זה מאוד אותו תוכן שרק 414 00:23:01,610 --> 00:23:04,830 ראיתי עם כמה שדות שלף. 415 00:23:04,830 --> 00:23:12,090 אז רשימה של כותרות, מיקום של מה הספר 416 00:23:12,090 --> 00:23:15,120 הוא על, השפה, וכן הלאה וכן הלאה. 417 00:23:15,120 --> 00:23:20,480 >> אז איך בעצם זה קרה, מאז אני מניח שאנחנו צריכים להסתכל על כמה קוד, 418 00:23:20,480 --> 00:23:22,420 is-- 419 00:23:22,420 --> 00:23:28,060 >> מה יש לנו כאן הוא HTML פשוט דף, שמציג את הטקסט, 420 00:23:28,060 --> 00:23:32,900 ברוכים הבאים לענן ספרייה ו לאחר מכן מציג טבלה של תוצאות. 421 00:23:32,900 --> 00:23:37,790 ויש כמובן אין תוצאות ב השולחן כאשר הדף נטען מקבל. 422 00:23:37,790 --> 00:23:41,380 אבל מה שאנחנו עושים הוא, קודם כל, אנחנו 423 00:23:41,380 --> 00:23:46,290 טוענים ספרייה שנקראת jQuery, שהוא בעצם 424 00:23:46,290 --> 00:23:52,030 ספריית JavaScript, שהופך אותו קל מאוד לתפעל JavaScript 425 00:23:52,030 --> 00:23:58,780 באופן מקורי, HTML, וליצור דפי אינטרנט, היגיון בצד הלקוח ודפי אינטרנט. 426 00:23:58,780 --> 00:24:01,595 >> אז מה יש לנו כאן הוא jQuery יש שיטה הנקראת קבל, 427 00:24:01,595 --> 00:24:05,270 אשר למעשה ילך ל כתובת אתר, אשר, במקרה זה, 428 00:24:05,270 --> 00:24:09,070 היא URL מחפשת המוכר הזה. 429 00:24:09,070 --> 00:24:14,440 אז ותקבל את התוכן מ כי כתובת אתר ולאחר מכן להפעיל פונקציה על זה. 430 00:24:14,440 --> 00:24:19,240 אז אמר תלכו לapi.lib.harvard / edu. 431 00:24:19,240 --> 00:24:20,060 לחפש את סופגניות. 432 00:24:20,060 --> 00:24:21,300 תן לנו 20 רשומות. 433 00:24:21,300 --> 00:24:28,590 ולאחר מכן להפעיל פונקציה, זה ש אני כבר נבחר, העברתו נתונים. 434 00:24:28,590 --> 00:24:34,430 והנתונים הוא JSON ש יש חזר מAPI. 435 00:24:34,430 --> 00:24:40,120 >> ואז אנחנו אומרים, בתוך ש הנתונים שיש שדה שנקרא פריט. 436 00:24:40,120 --> 00:24:48,117 ואם אני הולך להעיף מבט לאחור ב אחד מתוצאות אלה שנמצאים כאן, 437 00:24:48,117 --> 00:24:49,200 יש משהו called-- 438 00:24:49,200 --> 00:24:50,220 >> ובכן, זה נקרא פריט. 439 00:24:50,220 --> 00:24:53,520 כך שיכול להיות ש. 440 00:24:53,520 --> 00:25:01,840 ומה שהיא עושה זה עובר כל פריט 441 00:25:01,840 --> 00:25:05,300 ואז קורא עוד פונקציה על כל פריט. 442 00:25:05,300 --> 00:25:08,440 ופונקציה שבעצם הוא לוקח את הערך 443 00:25:08,440 --> 00:25:12,010 של הפריט, שהוא במהות השיא האישי 444 00:25:12,010 --> 00:25:18,220 ומאפשר לנו לשלוף את הכותרת, הכיסוי והשפה. 445 00:25:18,220 --> 00:25:21,640 >> אז אנחנו קוראים לפונקציה בכל פריט שחזרנו מAPI. 446 00:25:21,640 --> 00:25:25,397 ואם אתה רק תסתכל בקטע זה ממש כאן, 447 00:25:25,397 --> 00:25:27,230 מה שאנחנו עושים הוא אנו יוצרים מחרוזת, 448 00:25:27,230 --> 00:25:31,810 שהוא למעשה חלק סימון HTML סביב שולחן, עם value.title, 449 00:25:31,810 --> 00:25:35,790 שהוא השם של אובייקט, value.coverage, 450 00:25:35,790 --> 00:25:36,790 המהווה את הכיסוי, - 451 00:25:36,790 --> 00:25:38,225 >> ואנחנו עושים בדיקה כאן כדי לראות מי לא מוגדר 452 00:25:38,225 --> 00:25:40,570 ומסתיר את זה אם זה אומר לא מוגדר, בגלל שאנחנו לא באמת מעוניינים 453 00:25:40,570 --> 00:25:41,600 שב. 454 00:25:41,600 --> 00:25:42,939 >> --and אז השפה. 455 00:25:42,939 --> 00:25:44,730 ואז מה שאנחנו עושה הוא צירוף ש 456 00:25:44,730 --> 00:25:48,510 לשולחן שהוא זוהה על ידי מחרוזת זו כאן. 457 00:25:48,510 --> 00:25:50,790 ואיך jQuery עובד זה מה שזה אומר 458 00:25:50,790 --> 00:25:56,420 הוא מחפש את הטבלה עם רעיון תוצאות ולהוסיף טקסט זה לזה. 459 00:25:56,420 --> 00:25:59,380 וזה השולחן עם תוצאות רעיון. 460 00:25:59,380 --> 00:26:04,998 אז מה אתה בסופו של עם זה הוא דף כאן. 461 00:26:04,998 --> 00:26:06,206 ועל מנת להציג source-- 462 00:26:06,206 --> 00:26:11,310 463 00:26:11,310 --> 00:26:13,810 ובכן, המקור הוא לא ממש מתעדכן בעת ​​שקרה. 464 00:26:13,810 --> 00:26:18,740 אז אתה יכול לראות את עצמו תוצאות של הטבלה כאן אף. 465 00:26:18,740 --> 00:26:24,770 >> אז זה רק דוגמא פשוטה של עושה שאילתא בסיסית מאוד נגד API 466 00:26:24,770 --> 00:26:29,020 והצגת מידע בחלק אחר יוצר, ולא עושה שום דבר מפואר מדי. 467 00:26:29,020 --> 00:26:36,370 עכשיו, דוגמא נוספת היא כמו יישום נכתב על ידי דוד וינברגר 468 00:26:36,370 --> 00:26:39,120 כהדגמה לכך, ש במהות מראה לך 469 00:26:39,120 --> 00:26:44,620 איך אתה יכול לכתוש את התוצאות שאתה מקבל מAPI ענן הספרייה 470 00:26:44,620 --> 00:26:46,250 עם, אומר, Google Books. 471 00:26:46,250 --> 00:26:52,225 >> והחשיבה כאן היא שאני יכול להריץ שאילתא נגד Google Books, 472 00:26:52,225 --> 00:26:56,060 לקבל חיפוש טקסט מלא, תקבל כמה תוצאות בחזרה, לברר מי מהם הפריטים 473 00:26:56,060 --> 00:27:01,180 למעשה קיים בהוליס, מערכת הספרייה, 474 00:27:01,180 --> 00:27:03,200 ולאחר מכן לתת לי קישורים חזרה לפריטים אלה. 475 00:27:03,200 --> 00:27:12,730 אז אם אני מחפש, זה היה לילה חשוך וסוער, אני 476 00:27:12,730 --> 00:27:16,210 לחזור חבורה של תוצאות מ- Google, ולאחר מכן תוצאה אחת 477 00:27:16,210 --> 00:27:19,460 שהוא קמט בזמן. 478 00:27:19,460 --> 00:27:29,330 ואלה הם קישורים לספרים שקיימות במערכת ספריית אוניברסיטת הרווארד. 479 00:27:29,330 --> 00:27:32,160 >> אז אני מניח שהנקודה כאן היא לא עד כדי כך שיכול או לא יכול זה 480 00:27:32,160 --> 00:27:34,118 להיות הדרך שאתה רוצה כדי לחפש בספרייה, 481 00:27:34,118 --> 00:27:38,310 אבל זה שונה לגמרי דרך שלא היה זמין לך 482 00:27:38,310 --> 00:27:42,884 לפני, כמוך לא הייתה לו דרך לעשות טקסט מלא חיפושים על ספרים שאפילו 483 00:27:42,884 --> 00:27:44,550 היו חלק ממערכת ספריית אוניברסיטת הרווארד. 484 00:27:44,550 --> 00:27:46,870 אז עכשיו זו דרך שאתה יכול לעשות את זה. 485 00:27:46,870 --> 00:27:51,930 ואתה יכול להציג אותם ב כל פורמט שאתה רוצה. 486 00:27:51,930 --> 00:27:55,990 אז הנקודה כאן היא, בעצם, אנחנו פותחים דרכים חדשות לאנשים 487 00:27:55,990 --> 00:27:59,080 לעבוד עם נתונים. 488 00:27:59,080 --> 00:28:07,925 >> פיסת ענן ספרייה נוספת היא ש זה עוזר לחשוף חלק מנתוני השימוש 489 00:28:07,925 --> 00:28:08,800 שהספרייה יש. 490 00:28:08,800 --> 00:28:12,630 אז אם אתה הולך לספרייה, ושאתה מחפש ספרים, 491 00:28:12,630 --> 00:28:15,770 אתה לא בהכרח למעשה יש רעיון, 492 00:28:15,770 --> 00:28:19,080 לכל הפריטים ב נושא מסוים, מה ש 493 00:28:19,080 --> 00:28:21,200 אנשים ב קהילה, בין אם זה 494 00:28:21,200 --> 00:28:24,890 מוגדר כהרווארד או בכיתה שלך למדינה או, 495 00:28:24,890 --> 00:28:26,421 מה יש להם מצאו שימושי ביותר? 496 00:28:26,421 --> 00:28:28,920 והספרייה בעצם יש המון מידע על מה ש 497 00:28:28,920 --> 00:28:32,999 שימושי ביותר, כי אם הרבה אנשים בודקים את ספר, 498 00:28:32,999 --> 00:28:34,040 זה אומר לך משהו. 499 00:28:34,040 --> 00:28:36,498 בוודאי הייתה סיבה כלשהי הם רוצים לבדוק את זה. 500 00:28:36,498 --> 00:28:38,270 הרבה אנשים לשים אותו על מילואים. 501 00:28:38,270 --> 00:28:42,520 >> אם זה ברשימת העתודה להרבה של כיתות, שאומר לך משהו. 502 00:28:42,520 --> 00:28:45,960 אם חברי הסגל בודקים את זה יוצא המון לסטודנטים לתואר הראשון הם לא, 503 00:28:45,960 --> 00:28:47,200 זה אומר לי משהו. 504 00:28:47,200 --> 00:28:49,280 להיפך, שגם אומר לך משהו. 505 00:28:49,280 --> 00:28:54,680 אז זה יהיה ממש מעניין לשים את המידע שבחוץ ולתת לי 506 00:28:54,680 --> 00:28:59,969 אנשים להשתמש בו כדי לעזור להם למצוא עובד בתוך מערכת הספרייה. 507 00:28:59,969 --> 00:29:02,260 הצד השני של המטבע הזה הוא יש כמה רצינית פרטיות 508 00:29:02,260 --> 00:29:07,854 חששות כי אחד עיקרי ליבה של הספרייה 509 00:29:07,854 --> 00:29:10,770 הוא שאנחנו לא הולכים להיות אומרים לי אנשים מה שאנשים אחרים קוראים. 510 00:29:10,770 --> 00:29:17,360 וגם אם אתה אומר את זה הספר בדק ארבע פעמים 511 00:29:17,360 --> 00:29:20,070 בחודש מסוים, שיכול לשמש 512 00:29:20,070 --> 00:29:25,252 כדי לקשר בחזרה לבפרט אדם על ידי נתונים דה-anonymizing 513 00:29:25,252 --> 00:29:26,710 ולגלות שבדק את זה. 514 00:29:26,710 --> 00:29:30,792 אז הדרך שאנחנו יכולים avoid-- 515 00:29:30,792 --> 00:29:33,750 אופן שבו אנחנו יכולים לנסות לחלץ כמה אותות מכל המידע 516 00:29:33,750 --> 00:29:36,740 מבלי לפגוע חששות בנושאי הפרטיות של אף אחד 517 00:29:36,740 --> 00:29:42,150 הוא למעשה אנחנו מסתכלים על 10 שנים של נתוני שימוש, - 518 00:29:42,150 --> 00:29:43,930 >> אז זה על פני תקופה ארוכה של זמן. 519 00:29:43,930 --> 00:29:50,639 >> --and אומר, בסדר, בואו נראה איך פעמים רבות עבודה זו הייתה בשימוש, 520 00:29:50,639 --> 00:29:52,930 ועל ידי שבמשך תקופה זו זמן, ולאחר מכן בעצם 521 00:29:52,930 --> 00:29:56,300 להחזיר מספר, שאנו מכנים ציון ערימה, אשר בעצם 522 00:29:56,300 --> 00:29:59,910 מייצג כמה זה היה בשימוש. 523 00:29:59,910 --> 00:30:01,084 וnumber-- ש 524 00:30:01,084 --> 00:30:03,250 הרבה חישובים שונים ללכת למספר הזה. 525 00:30:03,250 --> 00:30:05,150 --but זה קשה מאוד מדד שנותן לך 526 00:30:05,150 --> 00:30:11,300 קצת מושג איך קהילה עשויה להעריך שעבודה. 527 00:30:11,300 --> 00:30:16,772 >> וכך נוסף גם סוג של יותר בשר החוצה יישום 528 00:30:16,772 --> 00:30:18,480 שמנצל זה משהו 529 00:30:18,480 --> 00:30:24,000 Stacklife נקרא, שהוא למעשה זמין דרך הרווארד הראשית 530 00:30:24,000 --> 00:30:24,880 פורטל ספרייה. 531 00:30:24,880 --> 00:30:26,700 אז אתה הולך לlibrary.harvard.edu. 532 00:30:26,700 --> 00:30:29,360 אתה תראה מספר שונה דרכים שונות לחיפוש בספרייה. 533 00:30:29,360 --> 00:30:32,300 ואחד מהם נקרא Stacklife. 534 00:30:32,300 --> 00:30:38,980 >> ואת זה הוא יישום ש גולש בתוכן של הספרייה, 535 00:30:38,980 --> 00:30:43,490 אבל בנוי לחלוטין על גבי ממשקי API אלה. 536 00:30:43,490 --> 00:30:46,910 כך שאין דברים מיוחדים קורה מאחורי הקלעים. 537 00:30:46,910 --> 00:30:49,570 אין גישה ל נתונים שאין לך. 538 00:30:49,570 --> 00:30:54,090 זה שימוש בממשקים API כדי לספק לך עם גלישה שונה לחלוטין 539 00:30:54,090 --> 00:30:55,480 ניסיון. 540 00:30:55,480 --> 00:30:58,570 >> אז אם אני מחפש את אליס בארץ הפלאות במקרה זה, 541 00:30:58,570 --> 00:31:02,600 אני מקבל תוצאה שנראית כמו זה, וזה די much-- 542 00:31:02,600 --> 00:31:05,430 543 00:31:05,430 --> 00:31:10,870 >> זה מאוד דומה לכל חיפוש אחר אתה יכול לעשות, מלבד במקרה זה 544 00:31:10,870 --> 00:31:15,730 אנחנו דירוג הפריטים על ידי stackscore, אשר נותנת לך 545 00:31:15,730 --> 00:31:19,850 קצת מושג איך פופולרי אלה פריטים היו בתוך הקהילה. 546 00:31:19,850 --> 00:31:25,610 וכך באופן ברור, בארץ הפלאות אליס על ידי וולט דיסני הוא פופולרי ביותר. 547 00:31:25,610 --> 00:31:36,570 אבל אתה גם יכול לראות את ארבעה העליונים כאן הם אלה שאתה לא יכול actually-- 548 00:31:36,570 --> 00:31:39,220 >> דברים שנמצאים בשימוש ביותר, אבל אתה לא יכול באופן מיידי 549 00:31:39,220 --> 00:31:41,240 להתחבר עם אליס בארץ הפלאות. 550 00:31:41,240 --> 00:31:44,650 אז ידידנו הוותיק המוער אליס היא כאן. 551 00:31:44,650 --> 00:31:46,350 אז אני יכול להעיף מבט בזה. 552 00:31:46,350 --> 00:31:52,010 ועכשיו מה שאני מחפש ביסודו של דבר נקבע של-- 553 00:31:52,010 --> 00:31:53,760 אני יכול להיות מוער אליס ממש כאן. 554 00:31:53,760 --> 00:31:56,700 יש לי מידע על זה. 555 00:31:56,700 --> 00:32:00,230 ויש לי גם stackscore של, במקרה זה, 26. 556 00:32:00,230 --> 00:32:03,169 וזה אומר לי סוג של בערך איך הגיע לזה stackscore, 557 00:32:03,169 --> 00:32:05,835 כמו שבדק את זה, כמו איך פעמים רבות זה היה בדק, 558 00:32:05,835 --> 00:32:08,440 כמו סגל או undergrads, איך עותקים רבים יש הספרייה, 559 00:32:08,440 --> 00:32:11,300 וכן הלאה וכן הלאה. 560 00:32:11,300 --> 00:32:16,460 >> ואתה גם יכול, מעניין מספיק כאן, לגלוש בערימות כמעט. 561 00:32:16,460 --> 00:32:19,550 כך שהנתונים כאן, זו הוא מראה לך סוג 562 00:32:19,550 --> 00:32:23,547 של ייצוג וירטואלי של מה כוח המדף 563 00:32:23,547 --> 00:32:25,880 נראה כמו אם היית לוקח כל אחזקותיה של הספרייה 564 00:32:25,880 --> 00:32:28,940 ולשים אותם ביחד על מדף אחד אינסופי. 565 00:32:28,940 --> 00:32:30,990 והדבר נחמד הוא שאנחנו can-- 566 00:32:30,990 --> 00:32:33,380 >> קודם כל, מטה-נתונים על ספרים אלה 567 00:32:33,380 --> 00:32:35,627 לעתים קרובות אומר לך כאשר פורסם. 568 00:32:35,627 --> 00:32:37,085 זה אומר לך כמה דפים יש לו. 569 00:32:37,085 --> 00:32:38,459 זה יכול להגיד לך את הממדים. 570 00:32:38,459 --> 00:32:42,930 אז אתה יכול לראות שהוא בא לידי ביטוי כאן במונחים של הגודל של הספרים. 571 00:32:42,930 --> 00:32:46,740 >> ואז אנחנו יכולים להשתמש ב מחסנית ציון כדי להדגיש 572 00:32:46,740 --> 00:32:49,170 הספרים שיש להם ציונים גבוהים יותר ערימה. 573 00:32:49,170 --> 00:32:54,930 אז אם זה כהה יותר, זה אומר ש, ככל הנראה, הוא משמש בתדירות גבוהה יותר. 574 00:32:54,930 --> 00:32:57,040 אז במקרה הזה, אני הולך לנחש שזה 575 00:32:57,040 --> 00:33:03,226 היא הגרסה של אליס בארץ הפלאות שמאוד נפוץ ורוב 576 00:33:03,226 --> 00:33:05,100 גישה, הספרייה יש רוב העותקים של. 577 00:33:05,100 --> 00:33:06,975 אז אם אתה מחפש לאליס בארץ הפלאות, 578 00:33:06,975 --> 00:33:10,220 זה יכול להיות מקום טוב להתחיל בו. 579 00:33:10,220 --> 00:33:13,500 >> ולאחר מכן גם כאן אתה יכול לקשר את ל, אומר, אמזון לרכוש את הספר, 580 00:33:13,500 --> 00:33:15,182 וכן הלאה וכן הלאה. 581 00:33:15,182 --> 00:33:17,140 הנקודה כאן, שוב, לא כל כך הרבה שזה 582 00:33:17,140 --> 00:33:25,030 היא הדרך הטובה ביותר כדי לגלוש בספרייה או את הכלי הנכון לכל אירוע. 583 00:33:25,030 --> 00:33:28,400 אבל זה בדרך אחרת לעשות את זה. 584 00:33:28,400 --> 00:33:31,359 ועל ידי ביצוע נתונים זמין דרך ה- API, ש 585 00:33:31,359 --> 00:33:34,650 עשוי מאובניים בניין פשוט מאוד, המאפשר לך לחפש התוכן, 586 00:33:34,650 --> 00:33:39,420 אתה יכול לבנות משהו כי ככה יכול 587 00:33:39,420 --> 00:33:41,520 להיות יוצא דופן חשוב לאנשים מסוימים. 588 00:33:41,520 --> 00:33:46,640 589 00:33:46,640 --> 00:33:51,860 >> אז זה סוג של, כמו שאני רוצה לומר באמת על מה הוא API 590 00:33:51,860 --> 00:33:56,070 ומה שהוא חושף, יש כל חבורה של דברים מאחורי הקלעים, ש 591 00:33:56,070 --> 00:33:59,480 אני רק הולך לגעת בבקצרה רק בגלל שזה סוג של מגיע בשלב זה 592 00:33:59,480 --> 00:34:03,720 מזווית שונה לחלוטין ב מונחים של איך עושה דבר כזה 593 00:34:03,720 --> 00:34:04,580 לקבל הכניס לתוך המקום? 594 00:34:04,580 --> 00:34:10,820 >> אז API הוא סטנדרטי ממשק לכל התוכן הזה. 595 00:34:10,820 --> 00:34:13,820 אבל כדי לקבל אותו שם, דבר הראשון שהיינו צריך לעשות 596 00:34:13,820 --> 00:34:17,260 היה למשוך יחד מידע ספרים ותמונות 597 00:34:17,260 --> 00:34:21,580 ועזרי מציאת, האוסף מסמך מהמערכות שונות של אוניברסיטת הרווארד. 598 00:34:21,580 --> 00:34:23,929 א ', VIA, וOASIS הם השמות של המערכות. 599 00:34:23,929 --> 00:34:28,820 והם בעצם נכנסו ל צינור, צינור עיבוד. 600 00:34:28,820 --> 00:34:33,230 >> אז קודם כל, אנחנו מקבלים יצוא קבצים מכל המערכות הללו. 601 00:34:33,230 --> 00:34:35,130 לפצל אותם לפריטים בודדים. 602 00:34:35,130 --> 00:34:39,360 אז יש לנו קובץ, שהוא ג 'יגה, שבו יש מיליון תקליטים בזה. 603 00:34:39,360 --> 00:34:42,290 אז אנחנו לפצל אותו לפריטים בודדים. 604 00:34:42,290 --> 00:34:45,374 לאחר מכן, עבור כל פריט, נוכל להמיר אותו לMODS, כי חלק מאלה 605 00:34:45,374 --> 00:34:47,040 הם MODS מקורי, חלקם לא. 606 00:34:47,040 --> 00:34:49,204 אז אנחנו מקבלים את כולם ל להיות באותה המתכונת. 607 00:34:49,204 --> 00:34:51,120 אז יש שונים צעדי העשרה, בי 608 00:34:51,120 --> 00:34:55,969 אנו מוסיפים מידע נוסף לנתונים ממה שהיה זמין בספרייה. 609 00:34:55,969 --> 00:34:59,750 אז אנחנו צריכים להוסיף, קודם כל יש לנו את מה שספריות להחזיק אותו. 610 00:34:59,750 --> 00:35:02,250 אנחנו עוברים שלב של חישוב stackscore. 611 00:35:02,250 --> 00:35:07,112 אנחנו עוברים שלב נוסף של הוספת metadata יותר במונחים 612 00:35:07,112 --> 00:35:10,730 של מה שאנשים אוספים ייתכן שהוסיפו זה-- 613 00:35:10,730 --> 00:35:12,532 >> אנשים יוצרים אוספים של פריטים. 614 00:35:12,532 --> 00:35:13,990 מה אוספים זה שייך? 615 00:35:13,990 --> 00:35:17,220 איך יש לי אנשים מתויגים תוכן זה בעבר? 616 00:35:17,220 --> 00:35:20,750 אז אתה לסנן, ואתה מגביל הרשומות כי, כפי שציינתי, 617 00:35:20,750 --> 00:35:24,120 יש כמה תקליטים ש, בגלל סיבות זכויות יוצרים, אנחנו לא יכולים להציג. 618 00:35:24,120 --> 00:35:26,700 ואז אנחנו מעלים אותם למשהו שנקרא 619 00:35:26,700 --> 00:35:31,680 Solr, שאינו שגיאת כתיב, אבל הוא השם של פיסת התוכנה 620 00:35:31,680 --> 00:35:35,710 שעושה אינדקס חיפוש, ש מניע את כל החיפוש מאחורי API. 621 00:35:35,710 --> 00:35:40,110 ואז הוא הופך להיות זמין ל API, והאנשים יכולים להשתמש בו. 622 00:35:40,110 --> 00:35:44,640 >> אז זה כמו למדי תהליך פשוט. 623 00:35:44,640 --> 00:35:47,230 אחד המעניין דברים על זה הוא 624 00:35:47,230 --> 00:35:50,990 שיש לנו עסק עם 13 מ'רשומות 625 00:35:50,990 --> 00:35:53,820 ואנחנו הולכים להיות התמודדות או יותר. 626 00:35:53,820 --> 00:36:01,260 ואנחנו רוצים להיות מסוגלים להתמודד עם אלה באופן יחסי מהיר. 627 00:36:01,260 --> 00:36:03,630 זה לוקח זמן ארוך לעבד 13 מ'רשומות. 628 00:36:03,630 --> 00:36:09,529 >> אז איך צינור זה הקים הוא שאתה can-- 629 00:36:09,529 --> 00:36:12,070 אני מניח שהיתרון של צינור, הבעיה שאנחנו 630 00:36:12,070 --> 00:36:15,580 מנסה לפתור כאן, הוא ש כל השינויים, כל 631 00:36:15,580 --> 00:36:18,729 השלבים הבאים בזה הצינור ניתן להפרדה. 632 00:36:18,729 --> 00:36:19,645 אין תלות. 633 00:36:19,645 --> 00:36:22,146 אם אתה עיבוד שיאו של ספר אחד, 634 00:36:22,146 --> 00:36:24,270 אין תלות ב שבין ספר אחר. 635 00:36:24,270 --> 00:36:27,760 >> אז מה אנחנו יכולים לעשות הוא בעצם, בכל שלב בצנרת, 636 00:36:27,760 --> 00:36:30,470 אנחנו שמים אותו לתוך תור בענן. 637 00:36:30,470 --> 00:36:32,250 יצאתי לי להיות בשירותי האינטרנט של אמזון. 638 00:36:32,250 --> 00:36:35,140 אז יש רשימה של, אומר, 10,000 פריטים ש 639 00:36:35,140 --> 00:36:38,100 צריך להיות מנורמל ו מרה לפורמט MODS. 640 00:36:38,100 --> 00:36:41,620 ואנחנו להסתובב שרתים רבים כפי שאנו רוצים, אולי 10 שרתים. 641 00:36:41,620 --> 00:36:44,860 וכל אחד מהשרתים האלה פשוט יושב שם, נראה שבתור, 642 00:36:44,860 --> 00:36:46,730 רואה שיש אחד שצריך להיות מעובד, מושך אותו מהתור, 643 00:36:46,730 --> 00:36:48,740 מעבד אותו, ומקלות זה בתור הבא. 644 00:36:48,740 --> 00:36:54,200 >> ואז מה שמאפשר לנו לעשות הוא להחיל, במהות, 645 00:36:54,200 --> 00:36:58,110 ככל חומרה כפי שאנו רוצים זה בעיה לתקופה קצרה מאוד של זמן 646 00:36:58,110 --> 00:37:02,970 כדי לעבד את הנתונים במהירות אפשרי, שזה משהו שרק, 647 00:37:02,970 --> 00:37:08,220 עכשיו בעולם של מחשוב ענן אנחנו יכולים שרתי הוראה במהות 648 00:37:08,220 --> 00:37:09,890 באופן מיידי, הוא ששימושי. 649 00:37:09,890 --> 00:37:12,260 אז אנחנו לא צריכים שנהיה לי שרת ענק יושב סביב 650 00:37:12,260 --> 00:37:16,700 כל הזמן לעשות את העיבוד שעלול לקרות רק פעם בשבוע. 651 00:37:16,700 --> 00:37:21,440 >> אז זה בעיקר זה. 652 00:37:21,440 --> 00:37:27,590 יש תיעוד זמין לAPI פריט ספריית הענן 653 00:37:27,590 --> 00:37:31,960 בכתובת זו, אשר תהיה יהיה זמין מאוחר יותר. 654 00:37:31,960 --> 00:37:36,730 ובבקשה תלכו להעיף מבט ב שלו כדי לראות אם יש משהו, 655 00:37:36,730 --> 00:37:37,579 יש לכם רעיונות. 656 00:37:37,579 --> 00:37:38,120 לשחק עם זה. 657 00:37:38,120 --> 00:37:38,830 להתעסק. 658 00:37:38,830 --> 00:37:42,800 ואני מקווה שאתה יכול לבוא עם משהו גדול. 659 00:37:42,800 --> 00:37:44,740 תודה לך. 660 00:37:44,740 --> 00:37:45,899