Унифицированное Местонахождение Ресурса (Uniform Resource Location, URL)

Разбор строки в экземпляр типа Url

url-badge cat-net-badge

Метод parse из крейта url делает синтаксический разбор и валидацию некоторой &str в структуру Url. Поскольку входная строка может быть некорректной, то метод возвращает Result<Url, ParseError>.

Как только строка, представляющая собой URL адрес оказывается разобрана в структуру типа Url, на этом экземпляре можно вызвать любой нужный метод.

extern crate url;

use url::{Url, ParseError};

fn main() -> Result<(), ParseError> {
    let s = "https://github.com/rust-lang/rust/issues?labels=E-easy&state=open";

    let parsed = Url::parse(s)?;
    println!("The path part of the URL is: {}", parsed.path());

    Ok(())
}

Получение базового URL адреса удалением сегментов пути

url-badge cat-net-badge

Базовый URL адрес включает в себя протокол и домен. Базовые URL адреса не имеют каталогов, файлов или параметров адресной строки. Каждый из этих элементов вырезается из переданного URL адреса. PathSegmentsMut::clear удаляет путь и Url::set_query удаляет строку параметров.

#[macro_use]
extern crate error_chain;
extern crate url;

use url::Url;

error_chain! {
    foreign_links {
        UrlParse(url::ParseError);
    }
    errors {
        CannotBeABase
    }
}

fn main() -> Result<()> {
    let full = "https://github.com/rust-lang/cargo?asdf";

    let url = Url::parse(full)?;
    let base = base_url(url)?;

    assert_eq!(base.as_str(), "https://github.com/");
    println!("The base of the URL is: {}", base);

    Ok(())
}

fn base_url(mut url: Url) -> Result<Url> {
    match url.path_segments_mut() {
        Ok(mut path) => {
            path.clear();
        }
        Err(_) => {
            return Err(Error::from_kind(ErrorKind::CannotBeABase));
        }
    }

    url.set_query(None);

    Ok(url)
}

Создание новых URL адресов из базового URL адреса

url-badge cat-net-badge

Метод join создаёт новый URL адрес из базового и относительного пути.

extern crate url;

use url::{Url, ParseError};

fn main() -> Result<(), ParseError> {
    let path = "/rust-lang/cargo";

    let gh = build_github_url(path)?;

    assert_eq!(gh.as_str(), "https://github.com/rust-lang/cargo");
    println!("The joined URL is: {}", gh);

    Ok(())
}

fn build_github_url(path: &str) -> Result<Url, ParseError> {
    const GITHUB: &'static str = "https://github.com";

    let base = Url::parse(GITHUB).expect("hardcoded URL is known to be valid");
    let joined = base.join(path)?;

    Ok(joined)
}

Извлечение начала URL адреса (схема / хост / порт)

url-badge cat-net-badge

Тип Url выставляет разные методы для извлечения различной информации из URL адреса.

extern crate url;

use url::{Url, Host, ParseError};

fn main() -> Result<(), ParseError> {
    let s = "ftp://rust-lang.org/examples";

    let url = Url::parse(s)?;

    assert_eq!(url.scheme(), "ftp");
    assert_eq!(url.host(), Some(Host::Domain("rust-lang.org")));
    assert_eq!(url.port_or_known_default(), Some(21));
    println!("The origin is as expected!");

    Ok(())
}

origin выдаёт тот же самый результат.

#[macro_use]
extern crate error_chain;
extern crate url;

use url::{Url, Origin, Host};

error_chain! {
    foreign_links {
        UrlParse(url::ParseError);
    }
}

fn main() -> Result<()> {
    let s = "ftp://rust-lang.org/examples";

    let url = Url::parse(s)?;

    let expected_scheme = "ftp".to_owned();
    let expected_host = Host::Domain("rust-lang.org".to_owned());
    let expected_port = 21;
    let expected = Origin::Tuple(expected_scheme, expected_host, expected_port);

    let origin = url.origin();
    assert_eq!(origin, expected);
    println!("The origin is as expected!");

    Ok(())
}

Удаление идентификаторов фрагментов и пар "параметр-значение" из URL адреса

url-badge cat-net-badge

Пример делает разбор Url и разбивает их с помощью url::Position чтобы отрезать ненужные части URL адреса.


extern crate url;

use url::{Url, Position, ParseError};

fn main() -> Result<(), ParseError> {
    let parsed = Url::parse("https://github.com/rust-lang/rust/issues?labels=E-easy&state=open")?;
    let cleaned: &str = &parsed[..Position::AfterPath];
    println!("cleaned: {}", cleaned);
    Ok(())
}