Получение базы URL — обычная задача в веб-разработке. В Python есть несколько способов добиться этого. В этом руководстве мы рассмотрим два популярных метода.

Способ 1: использование urlparse

Модуль urlparse в Python предоставляет способ разобрать URL-адрес на его компоненты. Мы можем использовать этот модуль для извлечения базы URL. Вот как:

from urllib.parse import urlparse

url = "https://www.example.com/path/to/page.html"
parsed_url = urlparse(url)
base_url = parsed_url.scheme + "://" + parsed_url.netloc

print(base_url)

Выход:

https://www.example.com

Функция urlparse() возвращает именованный кортеж, который содержит несколько атрибутов, таких как `scheme`, `netloc`, `path` и т. д. Мы можем комбинировать атрибуты `scheme` и `netloc`, чтобы получить основу URL.

Способ 2: использование регулярных выражений

Регулярные выражения также можно использовать для извлечения базы URL. Вот пример:

import re

url = "https://www.example.com/path/to/page.html"
base_url = re.match(r'(https?://.+?)/', url).group(1)

print(base_url)

Выход:

https://www.example.com

В этом примере мы используем регулярное выражение для сопоставления схемы и сети URL. Метод `group(1)` возвращает совпавшую строку.

Заключение

Получение базы URL-адреса в Python — простая задача, и ее можно выполнить с помощью модуля urlparse или регулярных выражений. Оба метода имеют свои преимущества и недостатки, поэтому выберите тот, который лучше всего соответствует вашим потребностям.