Přístup k internetu v Pythonu pomocí Urllib.Request a urlopen ()

Obsah:

Anonim

Co je to urllib?

urllib je modul Pythonu, který lze použít k otevírání adres URL. Definuje funkce a třídy pro pomoc s akcemi URL.

S Pythonem můžete také přistupovat a načítat data z internetu, jako jsou XML, HTML, JSON atd. Můžete také použít Python pro přímou práci s těmito daty. V tomto tutoriálu uvidíme, jak můžeme načíst data z webu. Například zde jsme použili adresu URL videa guru99 a k této adrese URL videa přistoupíme pomocí Pythonu a vytiskneme soubor HTML této adresy URL.

V tomto tutoriálu se naučíme

  • Jak otevřít URL pomocí Urllib
  • Jak číst soubor HTML pro vaši adresu URL v Pythonu

Jak otevřít URL pomocí Urllib

Než spustíme kód pro připojení k internetovým datům, musíme importovat příkaz pro modul knihovny URL nebo „urllib“.

  • Importovat urllib
  • Definujte svou hlavní funkci
  • Deklarujte proměnnou webUrl
  • Poté zavolejte funkci urlopen v knihovně URL lib
  • URL, kterou otevíráme, je výukový program guru99 na youtube
  • Dále vytiskneme výsledný kód
  • Výsledný kód se načte voláním funkce getcode v proměnné webUrl, kterou jsme vytvořili
  • Převedeme to na řetězec, aby jej bylo možné zřetězit s naším řetězcem „výsledný kód“
  • Bude to běžný kód HTTP „200“, což znamená, že požadavek HTTP byl úspěšně zpracován

Jak získat adresu URL souboru HTML v Pythonu

Soubor HTML můžete také číst pomocí funkce „čtení“ v Pythonu a při spuštění kódu se soubor HTML zobrazí v konzole.

  • Zavolejte funkci čtení na proměnné webURL
  • Proměnná Číst umožňuje číst obsah datových souborů
  • Přečíst celý obsah adresy URL do proměnné zvané data
  • Spusťte kód - vytiskne data do formátu HTML

Zde je kompletní kód

Příklad Pythonu 2

## read the data from the URL and print it#import urllib2def main():# open a connection to a URL using urllib2webUrl = urllib2.urlopen("https://www.youtube.com/user/guru99com")#get the result code and print itprint "result code: " + str(webUrl.getcode())# read the data from the URL and print itdata = webUrl.read()print dataif __name__ == "__main__":main()

Příklad Pythonu 3

## read the data from the URL and print it#import urllib.request# open a connection to a URL using urllibwebUrl = urllib.request.urlopen('https://www.youtube.com/user/guru99com')#get the result code and print itprint ("result code: " + str(webUrl.getcode()))# read the data from the URL and print itdata = webUrl.read()print (data)