Co je to urllib?
urllib je modul Pythonu, který lze použít k otevírání adres URL. Definuje funkce a třídy pro pomoc s akcemi URL.
S Pythonem můžete také přistupovat a načítat data z internetu, jako jsou XML, HTML, JSON atd. Můžete také použít Python pro přímou práci s těmito daty. V tomto tutoriálu uvidíme, jak můžeme načíst data z webu. Například zde jsme použili adresu URL videa guru99 a k této adrese URL videa přistoupíme pomocí Pythonu a vytiskneme soubor HTML této adresy URL.
V tomto tutoriálu se naučíme
- Jak otevřít URL pomocí Urllib
- Jak číst soubor HTML pro vaši adresu URL v Pythonu
Jak otevřít URL pomocí Urllib
Než spustíme kód pro připojení k internetovým datům, musíme importovat příkaz pro modul knihovny URL nebo „urllib“.
- Importovat urllib
- Definujte svou hlavní funkci
- Deklarujte proměnnou webUrl
- Poté zavolejte funkci urlopen v knihovně URL lib
- URL, kterou otevíráme, je výukový program guru99 na youtube
- Dále vytiskneme výsledný kód
- Výsledný kód se načte voláním funkce getcode v proměnné webUrl, kterou jsme vytvořili
- Převedeme to na řetězec, aby jej bylo možné zřetězit s naším řetězcem „výsledný kód“
- Bude to běžný kód HTTP „200“, což znamená, že požadavek HTTP byl úspěšně zpracován
Jak získat adresu URL souboru HTML v Pythonu
Soubor HTML můžete také číst pomocí funkce „čtení“ v Pythonu a při spuštění kódu se soubor HTML zobrazí v konzole.
- Zavolejte funkci čtení na proměnné webURL
- Proměnná Číst umožňuje číst obsah datových souborů
- Přečíst celý obsah adresy URL do proměnné zvané data
- Spusťte kód - vytiskne data do formátu HTML
Zde je kompletní kód
Příklad Pythonu 2
## read the data from the URL and print it#import urllib2def main():# open a connection to a URL using urllib2webUrl = urllib2.urlopen("https://www.youtube.com/user/guru99com")#get the result code and print itprint "result code: " + str(webUrl.getcode())# read the data from the URL and print itdata = webUrl.read()print dataif __name__ == "__main__":main()
Příklad Pythonu 3
## read the data from the URL and print it#import urllib.request# open a connection to a URL using urllibwebUrl = urllib.request.urlopen('https://www.youtube.com/user/guru99com')#get the result code and print itprint ("result code: " + str(webUrl.getcode()))# read the data from the URL and print itdata = webUrl.read()print (data)