Okay, sÃ¥, beregningsmÃ¦ssige kompleksitet. Bare lidt af en advarsel fÃ¸r vi dykker i alt for far-- dette vil sandsynligvis vÃ¦re blandt de mest matematiske-tunge ting vi taler om i CS50. ForhÃ¥bentlig vil det ikke vÃ¦re for overvÃ¦ldende og vi vil forsÃ¸ge at guide dig gennem processen, men bare lidt af en retfÃ¦rdig advarsel. Der er en lille smule af matematik involveret her. Okay, sÃ¥ for at gÃ¸re brug af vores it-ressourcer i den virkelige verden-det er virkelig vigtigt at forstÃ¥ algoritmer og hvordan de behandler oplysninger. Hvis vi har en rigtig effektiv algoritme, vi kan minimere mÃ¦ngden af ââressourcer vi har til rÃ¥dighed til at behandle den. Hvis vi har en algoritme, kommer til at tage en masse arbejde at behandle en virkelig store datasÃ¦t, er det vil krÃ¦ve mere og flere ressourcer, som er penge, RAM, alle den slags ting. 

SÃ¥ at kunne analysere et algoritme, der anvender dette vÃ¦rktÃ¸j sÃ¦t, dybest set, spÃ¸rger question-- hvordan gÃ¸r denne algoritme skala som vi smider flere og flere data pÃ¥ det? I CS50, mÃ¦ngden af ââdata er vi arbejder med er temmelig lille. Generelt er vores programmer gÃ¥r at kÃ¸re i en anden eller less-- sikkert en masse mindre isÃ¦r tidligt. 

Men tÃ¦nk pÃ¥ et firma, der handler med hundredvis af millioner af kunder. Og de har brug for at behandle at kundernes data. Da antallet af kunder, de har bliver stÃ¸rre og stÃ¸rre, det kommer til at krÃ¦ve flere og flere ressourcer. Hvor mange flere ressourcer? Tja, det afhÃ¦nger af, hvordan vi analysere algoritme, ved hjÃ¦lp af de vÃ¦rktÃ¸jer i denne vÃ¦rktÃ¸jskasse. NÃ¥r vi taler om kompleksitet en algorithm-- som undertiden vil du hÃ¸re det omtalt som tiden kompleksitet eller rum kompleksitet men vi bare at kalde complexity-- vi generelt taler om det vÃ¦rst tÃ¦nkelige scenarie. I betragtning af den absolutte vÃ¦rste bunke data, som vi kunne smide pÃ¥ det, hvordan denne algoritme vil forarbejde eller beskÃ¦ftige sig med disse data? Vi generelt kalder det vÃ¦rst tÃ¦nkelige runtime af en algoritme big-O. SÃ¥ en algoritme kan siges at kÃ¸re i O n eller O n potens. Og mere om, hvad dem betyde i et sekund. 

Nogle gange, selv om, vi gÃ¸r pleje om det bedste tÃ¦nkelige scenario. Hvis dataene er alt, hvad vi Ã¸nskede det at vÃ¦re, og det var helt perfekt og vi var at sende denne perfekte sÃ¦t af data gennem vores algoritme. Hvordan ville det hÃ¥ndtere i denne situation? Vi nogle gange henviser til, at sÃ¥ big-Omega, sÃ¥ i modsÃ¦tning til store-O, vi har big-Omega. Big-Omega for bedste fald. Big-O for det vÃ¦rst tÃ¦nkelige scenarie. Generelt, nÃ¥r vi taler om kompleksiteten af ââen algoritme, vi taler om den vÃ¦rst tÃ¦nkelige scenario. SÃ¥ holder det i tankerne. 

Og i denne klasse, er vi generelt gÃ¥r at forlade grundig analyse til side. Der er videnskaber og felter viet til den slags ting. NÃ¥r vi taler om rÃ¦sonnement via algoritmer, som vi vil gÃ¸re stykke-for-stykke for mange algoritmer vi taler om i klassen. Vi er virkelig bare taler om rÃ¦sonnement gennem det med sund fornuft, ikke med formler, eller beviser, eller sÃ¥dan noget. SÃ¥ du skal ikke bekymre dig, vil vi ikke vÃ¦re ved at blive en stor matematik klasse. 

SÃ¥ jeg sagde, at vi interesserer os for kompleksitet fordi det stiller spÃ¸rgsmÃ¥let, hvordan gÃ¸r vores algoritmer hÃ¥ndtere stÃ¸rre og stÃ¸rre datasÃ¦t kastes pÃ¥ dem. NÃ¥, hvad er et datasÃ¦t? Hvad gjorde jeg mener, nÃ¥r jeg sagde det? Det betyder, hvad gÃ¸r mest mening i sammenhÃ¦ng, at vÃ¦re Ã¦rlig. Hvis vi har en algoritme, den Processer Strings-- vi er nok tale om stÃ¸rrelsen af ââstrengen. Det er data set-- stÃ¸rrelsen, antallet tegn, der udgÃ¸r strengen. Hvis vi taler om en algoritme der behandler filer, vi mÃ¥ske tale om, hvordan mange kilobyte omfatter denne fil. Og det er datasÃ¦ttet. Hvis vi taler om en algoritme der hÃ¥ndterer arrays mere generelt, sÃ¥som sortering algoritmer eller sÃ¸ge algoritmer, vi nok taler om antallet elementer, der omfatter et array. 

Nu, vi kan mÃ¥le en algorithm-- i sÃ¦rdeleshed, nÃ¥r jeg siger, vi kan mÃ¥le en algoritme, jeg mener, vi kan mÃ¥le, hvor mange ressourcer, det tager op. Hvorvidt disse ressourcer er, hvor mange bytes RAM-- eller megabyte RAM det bruger. Eller hvor meget tid det tager at kÃ¸re. Og vi kan kalde denne mÃ¥le, vilkÃ¥rligt, f af n. Hvor n er antallet af elementer i datasÃ¦ttet. Og f af n er, hvor mange somethings. Hvor mange enheder af ressourcer gÃ¸r det krÃ¦ve at behandle disse data. 

Nu, vi faktisk ligeglad hvad f n er prÃ¦cis. Faktisk vi meget sjÃ¦ldent will-- helt sikkert vil aldrig i denne class-- I dykke ned i enhver virkelig dyb analyse af, hvad f n er. Vi er lige kommer til at snakke om, hvad f af n er ca. eller hvad det har tendens til. Og tendensen af ââen algoritme er dikteret af dets hÃ¸jeste orden sigt. Og vi kan se, hvad jeg mener med at ved at tage et kig pÃ¥ et mere konkret eksempel. 

SÃ¥ lad os sige, at vi har tre forskellige algoritmer. Hvoraf den fÃ¸rste tager n kubik, nogle enheder af ressourcer at behandle et datasÃ¦t stÃ¸rrelse n. Vi har en anden algoritme, der tager n kubik plus n firkantede ressourcer at behandle et datasÃ¦t stÃ¸rrelse n. Og vi har en tredje algoritme, der kÃ¸rer in-- at fylder n kubik minus 8n kvadreret plus 20 n enheder af ressourcer at behandle en algoritme med datasÃ¦t stÃ¸rrelse n. 

Nu igen, vi virkelig ikke vil at komme ind i dette niveau af detaljer. Jeg er virkelig bare har disse op her som en illustration af et punkt at jeg har tÃ¦nkt mig at vÃ¦re gÃ¸r i en anden, hvilket er, at vi kun virkelig pleje om tendensen ting som datasÃ¦ttene bliver stÃ¸rre. SÃ¥ hvis datasÃ¦ttet er lille, er der faktisk en temmelig stor forskel i disse algoritmer. Den tredje algoritme der tager 13 gange lÃ¦ngere tid, 13 gange den mÃ¦ngde ressourcer at kÃ¸re i forhold til den fÃ¸rste. 

Hvis vores datasÃ¦t er stÃ¸rrelse 10, som er stÃ¸rre, men ikke nÃ¸dvendigvis store, Vi kan se, at der er faktisk lidt af en forskel. Den tredje algoritme bliver mere effektiv. Det handler om faktisk 40% - eller 60% mere effektiv. Det tager 40% mÃ¦ngden af ââtid. Det kan run-- det kan tage 400 enheder af ressourcer at behandle et datasÃ¦t af stÃ¸rrelse 10. Mens den fÃ¸rste algoritme, derimod, tager 1.000 enheder af ressourcer at behandle et datasÃ¦t af stÃ¸rrelse 10. Men se, hvad der sker som vores tal bliver endnu stÃ¸rre. 

Nu forskellen mellem disse algoritmer begynder at blive lidt mindre synlige. Og det faktum, at der er lavere ordens terms-- eller rettere, vilkÃ¥r med lavere exponents-- begynder at blive irrelevant. Hvis et datasÃ¦t stÃ¸rrelse 1.000 og den fÃ¸rste algoritme kÃ¸rer i en milliard trin. Og anden algoritme kÃ¸rer i en milliard og en million trin. Og den tredje algoritme kÃ¸rer pÃ¥ bare genert af en milliard trin. Det er temmelig meget en milliard trin. Disse lavere ordens led starter til at blive virkelig irrelevant. Og bare for at virkelig hammer hjem point-- hvis input data er stÃ¸rrelse en million-- alle tre af disse temmelig meget tage en quintillion-- hvis min matematik er correct-- skridt at behandle en dataindgang stÃ¸rrelse million. Det er en masse trin. Og det faktum, at en af ââdem kan tage et par 100.000, eller et par 100 million endnu mindre, nÃ¥r vi taler om et nummer der big-- det er slags irrelevant. De har alle en tendens til at tage ca n kubik, og sÃ¥ ville vi faktisk henvise til alle disse algoritmer som vÃ¦rende af stÃ¸rrelsesordenen n kubik eller store-O n kubik. 

Her er en liste over nogle af de mere fÃ¦lles beregningsmÃ¦ssige kompleksitet klasser at vi vil stÃ¸de pÃ¥ algoritmer generelt. Og ogsÃ¥ specifikt i CS50. Disse er bestilt fra generelt hurtigste foroven, generelt langsomste nederst. SÃ¥ konstant tid algoritmer tendens at vÃ¦re den hurtigste, uanset af stÃ¸rrelsen af ââden datainput du passerer i. De har altid tage en operation eller en enhed af ressourcer at beskÃ¦ftige sig med. Det kunne vÃ¦re 2, det mÃ¥ske vÃ¦re 3, kan det vÃ¦re 4. Men det er et konstant antal. Det varierer ikke. 

Logaritmiske tid algoritmer er lidt bedre. Og en rigtig godt eksempel pÃ¥ en logaritmisk tid algoritme du har sikkert set af nu er det oprivning af telefonbogen at finde Mike Smith i telefonbogen. Vi sender problemet i halve. Og sÃ¥ n bliver stÃ¸rre og stÃ¸rre og larger-- i virkeligheden, hver gang du fordobler n, det tager kun et skridt. SÃ¥ det er meget bedre end fx lineÃ¦r tid. Hvilket er, hvis du dobbelt n, det tager fordoble antallet af trin. Hvis du tredoble n, det tager tredoble antallet af skridt. Et skridt pr. 

SÃ¥ tingene bliver lidt more-- lidt mindre fantastisk derfra. Du har lineÃ¦r rytmisk tid, nogle gange kaldet log lineÃ¦r tid eller bare n log n. Og vi vil et eksempel af en algoritme, kÃ¸rer i n log n, som stadig bedre end kvadratisk time-- n potens. Eller polynomiel tid, n to hvilket som helst antal stÃ¸rre end to. Eller eksponentiel tid, hvilket er endda worse-- C til n. SÃ¥ nogle konstant antal hÃ¦vet til magt stÃ¸rrelsen af ââinput. SÃ¥ hvis der er 1,000-- hvis input data stÃ¸rrelse 1.000, det ville tage C til 1000. magt. Det er meget vÃ¦rre end polynomiel tid. 

Faktorielt tid er endnu vÃ¦rre. Og i virkeligheden, virkelig gÃ¸re der Der findes uendelig tid algoritmer, sÃ¥som sÃ¥kaldte dum sort-- hvis job er at tilfÃ¦ldigt shuffle et array og derefter kontrollere, at se uanset om det er sorteret. Og hvis det ikke er, tilfÃ¦ldigt shuffle array igen og kontrollere, om det er sorteret. Og som kan du sikkert imagine-- du kan forestille dig en situation, hvor i det vÃ¦rst tÃ¦nkelige, der vil faktisk aldrig begynde med arrayet. Denne algoritme ville kÃ¸re for evigt. Og sÃ¥ det ville vÃ¦re et uendelig tid algoritme. ForhÃ¥bentlig vil du ikke skrive enhver fakultet eller uendelig tid algoritmer i CS50. 

SÃ¥ lad os tage lidt mere beton kig pÃ¥ nogle enklere beregningsmÃ¦ssige kompleksitet klasser. SÃ¥ vi har en example-- eller to eksempler her-- af konstant tid algoritmer, som altid tager en enkelt operation i det vÃ¦rst tÃ¦nkelige. SÃ¥ den fÃ¸rste example-- vi har en funktion kaldte 4 for dig, som tager en bred vifte af stÃ¸rrelse 1000. Men sÃ¥ tilsyneladende faktisk ikke ser pÃ¥ det-- ikke rigtig ligeglad, hvad der er inde i den, for den opstilling. Altid bare returnerer fire. SÃ¥ denne algoritme, pÃ¥ trods af, at det tager 1.000 elementer ikke gÃ¸re noget med dem. Bare returnerer fire. Det er altid et enkelt trin. 

Faktisk, tilsÃ¦ttes 2 nums-- som vi har set fÃ¸r, som well-- lige processer to heltal. Det er ikke et enkelt trin. Det er faktisk en par trin. Du fÃ¥r en, fÃ¥r du b, du tilfÃ¸je dem sammen, og du output resultaterne. SÃ¥ det er 84 trin. Men det er altid konstant, uanset a eller b. Du er nÃ¸dt til at fÃ¥ en, fÃ¥ b, tilfÃ¸j dem sammen, output resultatet. SÃ¥ det er en konstant tid algoritme. 

Her er et eksempel pÃ¥ en lineÃ¦r tid algorithm-- en algoritme, der tager gets-- et yderligere skridt, muligvis, som dit input vokser med 1. SÃ¥ lad os sige, at vi leder efter nummer 5 indersiden af ââet array. Du har mÃ¥ske en situation, hvor du kan finde det forholdsvis tidligt. Men man kunne ogsÃ¥ have en situation, hvor det kan vÃ¦re den sidste element i array. I en vifte af stÃ¸rrelse 5, hvis Vi leder efter nummer 5. Det ville tage 5 trin. Og i virkeligheden, forestille sig, at der er ikke 5 overalt i dette array. Vi har faktisk stadig nÃ¸dt til at se pÃ¥ hvert enkelt element af arrayet med henblik pÃ¥ at bestemme hvorvidt 5 er der. 

SÃ¥ i det vÃ¦rst tÃ¦nkelige, nemlig at elementet er sidst i arrayet eller findes ikke pÃ¥ alle. Vi har stadig til at se pÃ¥ alle de n elementer. Og sÃ¥ denne algoritme kÃ¸rer i lineÃ¦r tid. Du kan bekrÃ¦fte, at ved ekstrapolere en lille smule ved at sige, hvis vi havde en 6-element array og vi ledte efter nummer 5, det kan tage 6 trin. Hvis vi har en 7-element array og Vi leder efter nummer 5. Det kan tage 7 trin. Som vi tilfÃ¸je endnu en element til vores array, det tager endnu et skridt. Det er en lineÃ¦r algoritme i det vÃ¦rst tÃ¦nkelige. 

Par hurtige spÃ¸rgsmÃ¥l til dig. Hvad er runtime--, hvad der er det vÃ¦rst tÃ¦nkelige runtime af denne sÃ¦rlige stykke kode? SÃ¥ jeg har en 4 lÃ¸kke her, der kÃ¸rer fra j lig 0, hele vejen op til m. Og hvad jeg ser her, er, at organ af lÃ¸kken kÃ¸rer i konstant tid. SÃ¥ ved hjÃ¦lp af terminologi, Vi har allerede talt om-- hvad ville vÃ¦re det vÃ¦rst tÃ¦nkelige runtime af denne algoritme? Tag et sekund. Den indre del af slÃ¸jfen kÃ¸rer i konstant tid. Og den ydre del af loop kommer til at kÃ¸re m gange. SÃ¥ hvad er den vÃ¦rst tÃ¦nkelige runtime her? Vidste du gÃ¦tte big-O m? Du ville have ret. 

Hvad med en anden? Denne gang har vi en loop inde i en lÃ¸kke. Vi har en ydre slÃ¸jfe der lÃ¸ber fra nul til s. Og vi har en indre slÃ¸jfe, der kÃ¸rer fra nul til p, og inde i det, Jeg anfÃ¸rer, at kroppen loop kÃ¸rer i konstant tid. SÃ¥ hvad er den vÃ¦rst tÃ¦nkelige runtime af denne sÃ¦rlige stykke kode? NÃ¥, igen, har vi en ydre loop, der kÃ¸rer p gange. Og hver time-- iteration af denne lÃ¸kke, snarere. Vi har en indre slÃ¸jfe , der ogsÃ¥ kÃ¸rer p gange. Og sÃ¥ inde i det, der er den konstant time-- lille uddrag der. 

SÃ¥ hvis vi har en ydre lÃ¸kke, der kÃ¸rer p gange, inden i hvilken er en indre lÃ¸kke, kÃ¸rer p gange-- hvad der er det vÃ¦rst tÃ¦nkelige runtime af denne stump kode? Vidste du gÃ¦tte big-O af p potens? 

Jeg er Doug Lloyd. Det er CS50.