2016年08月13日

Python3でURLから{schema}://{domain}/を抜き出したい

http://www.example.com/foo/bar/baz というURLがあった時に、http://www.example.com/ の部分だけ抜き出したかった。

StackOverFlowにPython2での抜き出し方が書いてあった。Python3用だと下記のように書けるようだ。

from urllib.parse import urlparse
url = 'http://www.example.com/foo/bar/baz'
'{uri.scheme}://{uri.netloc}/'.format(uri=urlparse(url))
  #=> http://www.example.com/