eRIZ's weblog

mod_rewrite – (pozornie) beznadziejne problemy, które można rozwiązać

mod_rewrite, rewriting, przyjazne URL-e/adresy, maskowanie, przepisywanie, nazw jest sporo. Zresztą, najpopularniejsza pochodzi od swojego protoplasty – czyli mod_rewrite powstałego pod skrzydłami Apache’a jako moduł. Teraz właściwie standard, jeśli chodzi o nowoczesne strony www – nie tylko ze względu na wygląd, ale i (jak ptaszki ćwierkają, choć jest to wątpliwe wobec oficjalnych źródeł) SEO.

Jak zwał, tak zwał, adres http://example.org/kawalek/adresu wygląda dużo estetyczniej i jest łatwiejszy do zapamiętania niż potworki typu http://example.org/?kawalek=adresu&i=jeszcze&inny=fin

Niby nie jest to takie skomplikowane, ale niektóre sytuacje wydają się nie do rozwiązania.

Uwaga, notka tasiemcowata, więc jest spis treści. Polecam się również uzbroić w odpowiednią ilość czasu. ;]

Czyżby? – wstępniak
Z kopyta – podstawy
A nie łatwiej? – czy jest sens korzystania
Podstawowe praktyczne zastosowania – jo. (jak obok ;))

Banowanie po IP
Blokada przed hotlinkowaniem (no troszkę inna ;))
www, czy nie www
Wymuszanie szyfrowania połączenia
Z ukośnikiem na końcu, czy bez?

Częste pomyłki – najczęstsze błędy
Sprytne rozwiązania dzięki mod_rewrite – czy wiesz że…?
Przypadki beznadziejne – wyższa szkoła jazdy – co jest pozornie nie do rozwiązania
1. Przetwarzanie ciągu po znaku zapytania
2. przepisywanie adresu ze znakami specjalnymi – w tym polskimi
3. negocjacja zawartości bezpośrednio w Rewrite
Implementacja rzecz straszna – strona i skrypty – po stronie skryptów i klienta
Epilog

Czyżby?

Obrałem sobie kiedyś takie osobiste zadanie, aby chociaż spróbować zmierzyć się z każdym problemem związanym z przepisywaniem adresów na zrozumiałe dla skryptu formy. Rewriting to tak naprawdę forma zamaskowania tego, co widzą skrypty wobec postaci widzianej przez gości i przeglądarki. Jak to wygląda, patrz: zajawka (teaser).

Zacznijmy od problemów, które wiążą się z oczywistymi oczywistościami

Z kopyta

Żeby móc się tym jakkolwiek pobawić, trzeba zrozumieć parę rzeczy. Najważniejsza, to upewnić się, czy nasz serwer/demon w ogóle umożliwia wykorzystanie przepisywania adresów. Już chyba wszystkie hostingi udostępniają mod_rewrite gotowy do użycia.

Najpopularniejszy jest – rzecz jasna – format wprowadzony przez Apache, czyli zapisywanie regułek do plików htaccess. Są one bezproblemowo interpretowane przez serwery korzystające z demona z piórkiem w herbie oraz Litespeed. Niestety, pozostałe serwery nie obsługują nadpisywania konfiguracji w htaccess i powoduje to konieczność korzystania albo z obejść (tzn. przekierowywanie wszystkich żądań do skryptu zajmującego się tylko obrabianiem regułek), albo przepisywanie reguł na format danego serwera. Nie jest to zbyt trudne, ale często bywa uciążliwe chociażby z powodu dostępności do konfiguracji oraz konieczności restartowania demona. Owszem, powstawały już pewnego rodzaju pomysły na ominięcie tego problemu (np. htscanner), ale nie są one jeszcze tak satysfakcjonujące, jakbyśmy tego chcieli.

Skupię się na regułkach przystosowanych dla Apache/Litespeed (a to z tej racji, że napędzają większość rynku hostingowego).

We własnym warsztacie dobrze jest zainstalować Apache na własnym komputerze i w tym środowisku zająć się testowaniem regułek. Może to być również dowolny pakiet, który zawiera w sobie Indianina (WAMP, XAMP, LAMP, WebServ, itp), trzeba tylko pamiętać, aby w Linuksie pamiętać o skompilowaniu demona z flagą –enable-rewrite, a w Windows odkomentować linijkę z:

LoadModule rewrite_module modules/mod_rewrite.so

Czytaj: skasować z jej początku #. W niektórych przypadkach będzie również konieczne ustawienie dyrektywy AllowOverride All. Rzecz jasna, cały czas mam na myśli plik httpd.conf, po którego modyfikacji restartujemy demona. Jeśli w konfiguracji nie jest nic zepsute, wszystko powinno być OK i utworzenie pliku .htaccess (samo rozszerzenie) w katalogu htdocs z zawartością:

RewriteEngine On

nie wysypie nam serwera z błędem numer 500 po wywołaniu strony. Zakładam, że wszystko jest w porządku. Właśnie w ten sposób zaczniemy zabawę z przepisywaniem adresów. Wszystko sprowadza się do odpowiedniego manewrowania dyrektywami RewriteRule.

Przykładowy plik htaccess może wyglądać np. tak:

RewriteEngine On

RewriteBase /katalog RewriteRule ^kategoria/(.+) kategoria.php?co=$1

Składnia nie należy do szczególnie skomplikowanych. Podstawą przepisywania adresów jest znajomość wyrażeń regularnych, których omówienie jest tematem na jeden albo i na całą serię artykułów. Wyrażenia są dość przydatne, wykorzystywane w wielu sytuacjach. Może kiedyś o nich napiszę. [;

Podstawą dyrektywą, która dodaje wyrażenie do puli przetwarzanych, jest RewriteRule. Składnia jest następująca:

RewriteRule WYRAŻENIE ZAMIENNIK [FLAGI]

WYRAŻENIE, to wyrażenie regularne, którym zostanie przetestowany adres. Części, które zostaną wykorzystane w zamienniku otaczamy nawiasami.
ZAMIENNIK, to właściwy adres, który zostanie otwarty przez serwer. Aby wykorzystać frazy, które zostaną podstawione w miejsce nawiasów w zamienniku, korzystamy z formatu $1, $2 – liczba oznacza kolejny numer podstawnika w wyrażeniu regularnym. Przykładowe zastosowanie podałem we wcześniejszym listingu.
FLAGI, to dyrektywy którymi zostaną potraktowane regułki. W zasadzie, to przydatnych jest kilka, np.
- [QSA], co jest akronimem od Query String Append. Jeśli korzystamy z jakichkolwiek formularzy posługujących się metodą GET, reflinkami, etc, jest to flaga niezbędna. Powoduje ona dopisanie do wywoływanego skryptu ciągu zwanego QUERY_STRING, czyli wszystkiego po pytajniku w adresie.
- [L] – oznacza, że dana reguła jest ostatnią do przetwarzania. Wszystkie RewriteRule poniżej nie zostaną wykonane.
- [NC] – powoduje, że wyrażenie jest testowane niezależnie od wielkości znaków w adresie (domyślnie, wyrażenia regularne rozróżniają wielkie i małe litery)
- [R] – zamiast ukrycia prawdziwego adresu skryptu, serwer na niego przekierowuje (po ludzku: przeglądarka otwiera go tak, jakby był wpisany bezpośrednio do paska adresu). Opcjonalnie przyjmuje kod przekierowania, np. [R=301]
- [PT] – dość ciekawa, ale rzadko wykorzystywana flaga. Oprócz mod_rewrite, są również inne moduły, które operują na adresie skryptu, jak np. mod_alias, czy inne. Umieszczenie tej flagi powoduje, że pozostałe rozszerzenia Apache otrzymają do przetwarzania już przepisany adres.
Oczywiście flagi można łączyć podając je po przecinku, np. [L,NC,QSA].

Jeszcze powinienem wspomnieś o dyrektywnie zwanej RewriteBase. W wyrażeniach regularnych są dostępne znaki oznaczające początek oraz koniec frazy. Nieraz zdarza się tak, iż nasz katalog na stronę ma URL postaci np. http://example.org/~uzyszkodnik/ albo dowolny podkatalog względem głównego. Każdorazowe dopisywanie ~uzyszkodnik do wyrażenia byłoby uciążliwe. I tu pomaga RewriteBase, która określa ten początek dla wszystkich wyrażeń w pliku.

A nie łatwiej…?

No dobrze, można przecież cały ruch przekierować do jednego skryptu i z jego poziomu dokonywać dalszych przekierowań. Zapytam tylko – po co? Poza kilkoma niektórymi przypadkami nie ma to sensu, jest to tylko marnowanie mocy na przetwarzanie żądania przez interpreter skryptów, który może odciążyć właśnie silnik przepisywania adresów.

W jakich sytuacjach można pominąć? W zasadzie zawsze. ;] Chociażby wyświetlanie galerii zdjęć, czy też cache całych stron, ale o tym później.

W praktyce jest nieco inaczej – wiele gotowych skryptów/bibliotek przerzuca przepisywanie bezpośrednio do własnych mechanizmów ze względów przenośności – aby ten sam skrypt mógł działać na jak największej liczbie serwerów (pamiętajmy, że jest wiele innych demonów, w których konfiguracja przepisywania adersów jest zupełnie inna) oraz z innych szczególnych względów, o których powiem później.

podstawowe praktyczne zastosowania

Tutaj przede wszystkim przyda się nam dyrektywa RewriteCond. Umożliwia ona warunkowe wykonanie najbliższego przepisywania. Składnia?

RewriteCond %{testowana_zmienna} wyrażenie [FLAGI]

testowana_zmienna – jest to jedna z typowych zmiennych dla skryptów. Jest to np. znaczna większość pozycji z PHP-owej zmiennej predefiniowanej $_SERVER, np. IP klienta, przeglądarka, itp. Pełna lista dostępna jest na stronach Apache.
wyrażenie – wyrażenie regularne, którego spełnienie jest jednoznaczne z „przepuszczeniem” warunku (warunek zwraca PRAWDA)
flagi – tu są tylko dwie: NC i OR. Pierwsza jest analogiczna, co w RewriteRule – ignoruje wielkość znaków, natomiast druga – sprawia, że wyrażenie jest łączone z następnym przez alternatywę (odpowiednik if … else if …).

Banowanie po IP

Jeśli chodzi o banowanie na poziomie serwera przez deny from all, to ma jedną, ale za to zasadniczą wadę – uniemożliwia wyświetlenie eleganckiego komunikatu dla użytkownika. Owszem, można skorzystać z własnych stron błędów, ale wówczas np. nie zapiszemy, który konkretnie adres IP nam szczególnie daje się we znaki. Gotową listę adresów można pobrać z np. ze strony projektu Sblam!

Tworzymy wówczas htaccess o mniej więcej takiej zawartości:

RewriteEngine On

RewriteCond %{REMOTE_ADDR} ^(255\.255\.255\.255)|(0\.0\.0\.0)$ RewriteCond %{REQUEST_URI} !^ban\.php$ RewriteRule . ban.php [L,R]

I teraz łopatologiczne wyjaśnienie:

Najpierw sprawdzamy, czy IP jest na naszej czarnej liście. – adresy są przykładowe, zamiast podanych podajemy te, które chcemy zablokować. Kropki escape’ujemy, czyli poprzedzamy odwrotnym ukośnikiem – aby kropka była interpretowana jako kropka, a nie dowolny znak. Nawiasy stanowią pogrupowanie wyrażeń, pionowa kreska – je oddziela.
Sprawdzamy, czy nie banujemy przypadkiem strony z błędem. – gdyby nie sprawdzać, to całe nasze działanie nie miałoby po prostu sensu. Jak pewnie zauważyłeś(aś), wykrzyknik przed wyrażeniem stanowi jego zanegowanie.
Przekierowujemy klienta na stronę błędu. – chyba bez komentarza. ;]

Oczywiście rozwiązanie jest dobre tylko dla niewielkiej liczby adresów – przy większej już lepiej obarczyć tym wykonywany skrypt.

Ale jeśli chcemy wyciąć całe klasy, to nie ma problemu – możemy również użyć rewrite:

RewriteCond %{REMOTE_ADDR} ^(255\.255\.255\.[0-9]+)$

Wystarczy podmienić ze wcześniejszym RewriteCond, z listingu powyżej.

Wycinanie całego IP może być bolesne dla sieci osiedlowych. Wielu adminów przychodzi nam z pomocną dłonią i wypuszcza w nagłówku X-Forwarded-For wewnętrzny adres IP. Wtedy można wyciąć tylko tego delikwenta, jeśli adres jest nam znany.

RewriteEngine On

RewriteCond %{REMOTE_ADDR} ^(255\.255\.255\.255)|(0\.0\.0\.0)$ RewriteCond %{HTTP:X-Forwarded-For} ^(192\.168\.0\.2)$ RewriteCond %{REQUEST_URI} !^ban\.php$ RewriteRule . ban.php [L,R]

Blokada przed hotlinkowaniem

Transfer jak woda – nie za darmo, rachunki też za to są naliczane. Wiele osób zamiast chociaż przegrać obrazki do siebie, linkuje bezpośrednio do naszych. Można ten proceder utrudnić (nie ukrócić).

Najprostszą metodą jest po prostu odcięcie od źródła – czyli blokowanie jakichkolwiek żądań z obcych stron. Ale czemu by nie wyświetlić zamiast tego reklamy? ;] „Uniwersalna” byłaby nie do końca OK – nie wszystkie obrazki przecież mają takie same wymiary. Proste założenie – sprawdzamy nagłówek referer, jeśli nie ma tam naszej strony – serwujemy reklamówkę. Ale w taki sposób, że pobieramy z poziomu skryptu url do właściwego obrazka, pobieramy wymiary i generujemy własny o odpowiednich. Co dalej? Inwencja autora. ;] Oczywiście nie jest to rozwiązanie stuprocentowe – wiele zapór, czy pakietów bezpieczeństwa po prostu blokuje wysyłanie nagłówka http_referer.

Ale tak, czy tak – zawsze będzie to utrudnienie. W praktyce? Sprawa jest prosta:

RewriteEngine On RewriteCond %{HTTP_REFERER} !http://example\.org [NC] RewriteRule ^(.+)\.(jpg|gif|jpeg|png)$ hotlink.php?img=$1.$2 [L]

I teraz wszystko dostajemy w zmiennej $_GET[’img’]. Co teraz? A powiedzmy, że coś napiszemy. :]

Interpretacja ścieżek, innych – inwencja autora. Można również wygenerować obrazek i na niego przekierowywać, możliwości jest mnóstwo. Moim zdaniem, najlepiej wygenerować i wysłać na jakiś darmowy hosting w celu oszczędzenia transferu. :]

www, czy nie www?

To pytanie odwiecznie wzbudza kontrowersje. Ja jestem tego samego zdania, co autorzy kampani no-www – www, to nie jest żaden protokół, ludziom już od dawna się jednoznacznie kojarzy ciąg strona.com ze stroną w Sieci.

Przyzwyczajenie jednak drugą naturą człowieka i nie można takiego odciąć od naszych stron. Ciekawie robi np. last.fm, który przekierowuje na preferowaną przez autorów wersję.

Tu wystarczy prosta regułka:

RewriteEngine On

RewriteCond %{HTTP_HOST} ^www\.(.+)$ [NC] RewriteRule ^(.*)$ http://%1/$1 [R=301,L]

Aby pozbyć się za każdym razem www w adresie. Kod zapożyczony ze strony kampanii no-www. Aby zrobić na odwrót, zmodyfikujemy lekko regułki:

RewriteEngine On RewriteCond %{HTTP_HOST} !^www\.(.+)$ [NC] RewriteRule ^(.*)$ http://www.%1/$1 [R=301,L]

Jak pewnie zauważyłeś(aś), skorzystano tutaj z wartości z wyrażenia przetwarzanego w RewriteCond, tym zajmiemy się później, jak to praktycznie wykorzystać.

wymuszanie szyfrowania połączenia

Bezpieczeństwo w dzisiejszych czasach jest kwestią coraz ważniejszą. Certyfikat SSL dla strony nie jest dzisiaj już wydatkiem fortuny, jak to było jeszcze parę lat temu.

Oczywiście nie ma sensu być kimś przewrażliwionym i szyfrowanie danych dostępu publicznie jest tylko marnowaniem mocy procesora serwera. Zaczniemy jednak od włączenia SSL dla strony rejestracji/logowania użytkownika:

RewriteCond %{HTTPS} off RewriteRule ^/(rejestracja|logowanie) https://%{HTTP_HOST}%{REQUEST_URI} [R,L]

I rejestracja/logowanie będzie przebiegało przez bezpieczne połączenie z serwerem. Dobrze by było wymusić wyświetlanie obrazków oraz pozostałych strony przez zwykły HTTP.

RewriteCond %{HTTPS} on RewriteRule ^/(^[rejestracja|logowanie]) http://%{HTTP_HOST}%{REQUEST_URI} [R,L]

RewriteCond %{HTTPS} on RewriteCond %{REQUEST_URI} \.(gif|png|jpg|css|js)$ RewriteRule (.*) http://%{HTTP_HOST}%{REQUEST_URI} [R,L]

I to tyle, jeśli chodzi o SSL.

z ukośnikiem na końcu, czy bez?

Kolejna kwestia spędzająca nieraz sen z powiek osobie, która próbuje się pozbyć ukośnika na końcu. Na początku trzeba ustalić jedną rzecz – nie da się, powtarzam – nie da się usunąć slesza na końcu ścieżki, jeśli istnieje katalog o tej nazwie. Próbowałem na wszelakie możliwe sposoby, pytałem i wniosek – nie da się (jeśli jednak się da – będzie fajnie, gdy mnie ktoś oświeci ;)). Jedyne wyjście – zaprefiksowanie nazwy katalogu i subtelne przekierowywanie żądań.

Na co trzeba uważać? Żeby nie wpaść w zapętlone przekierowanie. ;]

RewriteCond %{REQUEST_URI} (.*)/$ RewriteCond %{REQUEST_FILENAME} !-d RewriteRule ^([a-zA-Z\-]+)/$ /$1 [R=301,QSA,L]

I powinno być ok. ;]

częste pomyłki

Podstawowe triki już omówiłem, teraz pora na najczęstsze błędy przy przepisywaniu adresów. Większość w oparciu o problemy poruszane na Polskim Forum PHP.

Zamiana parametrów w RewriteRule.
Zdarzył się jeden taki przypadek, że ktoś pisząc regułkę zamienił miejscami wzorzec z zamiennikiem. Pamiętaj: składnia RewriteRule zawsze jest następująca:

RewriteRule WZORZEC ZAMIENNIK [FLAGI]

I nigdy inna. Problem może często występować przy próbie uwzględniania spacji jako wzorca. Spacja jest znakiem rozdzielającym wzorzec z zamiennikiem i należy ją zawsze poprzedzić odwróconym ukośnikiem, aby ją uwzględnić czy to we wzorcu, czy w zamienniku.
Przejście na przyjazne adresy i zamaina linków.
Ok, regułki są, testy się udają, ale jest pewien prozaiczny problem – w kodzie linki się same nie zmienią. Musisz je zmienić ręcznie na nową konwencję. Owszem, można skorzystać z buforowania wyjścia w PHP i je zamienić korzystając z wyrażeń regularnych, ale jest to nieco bez sensu. Gdy już zamienisz linki, dobrą praktyką jest powiadomienie wyszukiwarek, który rodzaj odnośników powinny wyświetlać w wynikach wyszukiwarki. O tym pod koniec notki.
Zasięg RewriteCond.
Wiele osób zapomina o pewnej dość istotnej kwestii – wszystkie RewriteCond obowiązują tylko do najbliższego RewriteRule. Następne wykonają się już bezwarunkowo. Rozwiązań tego problemu jest kilka:
1. Powtórzyć bloki z RewriteCond tyle razy, ile korzystamy z RewriteRule (przy dwóch, trzech jest znośnie, przy większej ilości – masochizm)
2. Zmodyfikować testowane wyrażenia tak, aby zbić je do jednego (patrz: przykład z adresami IP – nie rozdzielałem adresów IP, tylko je łączyłem). Niestety, nie da się tak ze wszystkim, gdyż testowane zmienne mogą być różne.
3. Przerzucić obsługę przepisywanych adresów bezpośrednio do skryptu sprawdzając jedynie, czy istnieją pliki/katalogi, czy nie. O tym już na koniec artykułu.
Zastosowanie wszędzie tych samych wzorców.
To właściwie problem konstrukcji/rozumienia składni wyrażeń regularnych. Rozważmy przykład:

RewriteRule ^index,([0-9]),([a-zA-Z]+),([a-zA-Z]+),([a-zA-Z]+)$ index.php?set=$1&id=$2&get=$3&show=$4 RewriteRule ^index,([0-9]),([a-zA-Z]+),([a-zA-Z]+),([a-zA-Z]+)$ index.php?set=$1&id=$2&get=$3&pokaz=$5 RewriteRule ^index,([0-9]),([a-zA-Z]+),([a-zA-Z]+),([a-zA-Z]+)$ index.php?set=$1&id=$2&get=$3&polecamy=$6

Pytanie było na forum – dlaczego przetwarza mi tylko pierwszą regułkę? Ależ odpowiedź jest prosta – skąd Rewrite ma wiedzieć, które regułka jest przypisana do konkretnego działu? [; Trzeba w jakiś sposób to rozróżnić:

RewriteRule ^index,([0-9]),([a-zA-Z]+),([a-zA-Z]+),show$ index.php?set=$1&id=$2&get=$3&show=show RewriteRule ^index,([0-9]),([a-zA-Z]+),([a-zA-Z]+),pokaz$ index.php?set=$1&id=$2&get=$3&pokaz=pokaz RewriteRule ^index,([0-9]),([a-zA-Z]+),([a-zA-Z]+),polecamy$ index.php?set=$1&id=$2&get=$3&polecamy=polecamy

I teraz jest ok.
Stosowanie kropek we wzorcach.
Ponownie program związany bardziej z wyrażeniami regularnymi. Kropka jest składnikiem wzorca dopasowującym dowolny znak. Wystarczy poprzedzić ją backslashem (\.) i będzie ok.
Błędne przetwarzanie liczby argumentów
Załóżmy że mamy podział /strona/podstrona i następujące reguły:
RewriteRule (.+) index.php?strona=$1 [L] RewriteRule (.+)/(.+) index.php?strona=$1&podstrona=$2 [L]

Co jest nie tak? Podstrony nigdy nie wywołamy w ten sposób. Dlaczego? Gdyż pierwsze wyrażenie będzie pasowało zarówno do linku z podstroną jak i tej bez. Dlatego trzeba zamienić reguły miejscami tak, aby największa liczba przetwarzanych parametrów była interpretowana na samym początku.

RewriteRule (.+)/(.+) index.php?strona=$1&podstrona=$2 [L] RewriteRule (.+) index.php?strona=$1 [L]

sprytne rozwiązania dzięki mod_rewrite

Przepisywanie adresów, to nie tylko sposób na lepsze zaprezentowanie URL, ale także sposób na podniesienie funkcjonalności serwisu, czy też logiki aplikacji. Zresztą – zobacz. (;

Wydzielenie katalogu public_html

Niestety, zdarzają się nadal prymitywne hostingi, które wszystkie wgrywane przez FTP pliki wrzucają do katalogu publicznego. Jakie to niesie za sobą skutki? Chyba nie trzeba mówić – mniejsze bezpieczeństwo skryptów, trzeba pilnować newralgicznych danych.

Męcząc się z CakePHP w jego pliku htaccess natrafiłem na fajne rozwiązanie:

RewriteEngine On RewriteRule ^(.*)$ public_html/$1

Jedna linijka i mamy katalog public_html. Wszystkie pozostałe regułki wrzucamy do osobnego htaccess znajdującego się w katalogu publicznym.

wirtualne subdomeny

Widziałeś(aś) pewnie nieraz serwisy korzystające z konwencji użytkownik.strona.pl. Nie, to nie są osobno tworzone subdomeny. Z takich adresów korzysta np. BLIP. Jest tak naprawdę jedna kopia skryptu, nikt niczego przy nowej rejestracji nie podpina, wszystki dzieje się automatycznie.

Trzeba przede wszystkim zacząć od konfiguracji DNS w hostingu/na serwerze. Dana domena musi miec uaktywniony tzw. wildcard, czyli opcję, która nakazuje serwerowi użycie zawartości z głównej domeny dla każdej nieistniejącej domeny. Jeśli nie ma takiej opcji w panelu administracyjnym, wystarczy zazwyczaj mail do administratora. Jeśli korzystamy z serwera dedykowanego/własnego – modyfikujemy pliki binda oraz Apache.

Wtedy wystarczy już odpowiedni htaccess w katalogu głównej domeny:

RewriteCond %{HTTP_HOST} ^([^.]+)\.example\.org [NC] RewriteRule ^(.*) http://example.org/?user=%1 [QSA]

I w parametrze $_GET[’user’] będziemy mogli zidentyfikować użytkownika na podstawie subdomeny.

jeden serwis, podobne domeny – wiele języków

Nasza firma działa międzynarodowo, serwis posiada kilka wersji językowych. Mamy domeny firma.pl, firma.com, firma.co.uk, firma.ru. Dlaczego tworzyć osobne wersje stron dla każdego języka? Nie jest to może za bardzo SEO-przyjazne, ale koncepcyjnie – da się. Zawsze można to wykorzystać w innym celu:

RewriteCond %{http_host} firma\.([a-z\.0-9]+)$ [NC] RewriteRule ^(.*) http://firma.com/?lang=%1 [R=301,L,QSA]

I w zależności od oddziału jesteśmy przekierowywani na stronę centrali firmy z odpowiednio ustawionym językiem.

przypadki beznadziejne – wyższa szkoła jazdy

Niektóre sytuacje pozornie wydają się beznadziejne, ale to nie znaczy, że nie da się ich w ogóle rozwiązać. :] Jak to mawiają, zadanie nierozwiązywalne jest tylko pozornie nie do rozwiązania – wymaga jedynie większego nakładu czasu.

przetwarzanie ciągu po znaku zapytania

Zmieniamy konwencję odnośników na stronie, ale zależy nam na szybkim uwzględnieniu tego w wyszukiwarkach. Chcemy brzydkie adresy zamienić na te ładniejsze również w wynikach wyszukiwania.

Technicznie adresy będą nadal rozpoznawane – to w większości przypadków nie będzie stanowiło problemu. Trzeba jednak powiadomić wyszukiwarki, że zmiana nastąpiła. Jeśli stary schemat adresów również polegał na mod_rewrite, nie będzie problemu. Gorzej, gdy jest to konwencja bazująca na tzw. QUERY_STRING, czyli w stylu index.php?strona=asd&dzial=xyz.

Wiele osób próbuje bezpośrednio poszukiwać odpowiedniego ciągu przez RewriteRule. Niestety, nie ma to prawa zadziałać, gdyż ciąg po znaku zapytania jest dopisywany po adresu dopiero po operacji maskowania. Trzeba więc posłużyć się inną metodą:

RewriteCond %{QUERY_STRING} strona=([^&;]*) RewriteCond %{QUERY_STRING} dzial=([^&;]*) RewriteRule . /%1/%2 [R=301]

Czemu takie „dziwne” wzorce? Jest to tzw. negacja znaków, czyli innymi słowy wszystkie oprócz znaku „&” i średnika. Są to separatory ścieżki, więc trzeba wszystko wydzielić, gdyż parametrów może być kilka. W ten sposób wyszukiwarki będą wiedziały od najbliższego przeindeksowania, którą wersję adresu wyświetlić.

przepisywanie adresu ze znakami specjalnymi

O ile znaki z alfabetu plus cyfry/podkreślenia/plusy nie są problemem przy przepisywaniu, to nieraz zdarza się tak, że zachodzi konieczność skorzystania ze znaków specjalnych w adresach (patrz: adresy w Wikipedii).

Popatrzmy chociaż na nawiasy, czy spacje w adresach. W wyrażeniach regularnych są one odpowiednio znakami specjalnymi, a w Rewritingu – separatorem wzorca i zamiennika. Aby bezproblemowo ich użyć, trzeba poprzedzić je odwrotnym ukośnikiem:

RewriteRule ^dzial$(a-z)+$ index.php?dzial=$1 [L]

Osobnym tematem są polskie znaki. Tu zaczynają się schody, które wynikają z pewnych (błędnych) założeń:

polskie znaki zawierają się w klasie [a-z] – błąd! Dla nas to oczywiste, że polskie diakrytyki mają swoje miejsce w alfabecie, ale czy wyrażenia regularne, to produkt polski? Nie – co by było np. w sytuacji Cyrylicy? Spowodowałoby to ogromny bałagan. Jednak wzorzec dowolnego znaku (kropka) pozwala na przesłanie naszych rodzimych literek dalej.
wszystkie przeglądarki wysyłają polskie znaki w tym samym kodowaniu – niestety – prawda jest okrutna. Jedna przeglądarka wyśle w utf-8, inna w iso-8859-2, a jeszcze inna rozbije na jakieś dziwne znaki. Trzeba sprawdzać przeglądarkę gościa i dokonywać odpowiednich przekierowań. Stąd odpada ręczne wpisywanie polskich znaków do zakresów (np. [a-ząćęłóńśźż])

Wówczas trzeba albo skorzystać ze sprawdzania przeglądarki poprzez powielenie zestawu reguł z innym kodowaniem, albo przekierowanie do skryptu i testowanie.

Uniwersalne przekierowanie dla wszystkich skryptów jest dość proste:

RewriteEngine On RewriteCond %{REQUEST_FILENAME} !-f RewriteRule . index.php [L]

Po co jest ten RewriteCond? Ano po to, aby serwer normalnie wysyłał obrazki, a nie obarczał tym zadaniem skrypt. ;]

negocjacja zawartości bezpośrednio w Rewrite

Ilu łebmajstrów się napociło przy tym, aby w jakiś sposób sprawdzać, w jakim MIME wysyłać dokumenty HTML… application/xhtml+xml, czy text/html? Fakt – niektóre przeglądarki wprowadzają obostrzenia.

Czasem nie ma to znaczenia, a i statyczne pliki powinny mieć negocjację zawartości (np. cache pełnych stron). Owszem, można osobny skrypt, ale jaki jest sens czegoś takiego, skoro Apache jest w stanie wykonać to dość sprawnie? ;]

RewriteCond %{REQUEST_URI} -f RewriteCond %{REQUEST_URI} \.htm RewriteCond %{HTTP:Accept} application/xhtml+xml RewriteRule (.+) $1 [T=application/xhtml+xml]

implementacja rzecz straszna – strona i skrypty

Rewrite, to nie tylko kwestia serwera – to także pewne różnice w konstrukcji skryptów i samych stron. Tu też można popełnić nieco błędów i to wcale nie takich oczywistych. Ale o tym później. ;]

łatwe i szybkie generowanie identyfikatorów przyjaznych dla URL

Zadanie jest niby proste: z podanego ciągu znaków (np. tytułu) mamy utworzyć identyfikator, który nie będzie encjowany (czytaj: wszystkie znaki nie zamienią się na stos procentów i liczb).

Co robimy? Polskie znaki zamieniamy na łacińskie odpowiedniki, spacje na myślniki.

function ident($string){ $string = str_replace(' ', '-', $string); $string = iconv('utf-8', 'ascii//translit', $string); $string = preg_replace('#[^a-z0-9\-\.]#si', '', $string); return str_replace('\'', '', $string); }

Jak to działa? A spróbuj sam(a). ;]

łatwe korzystanie z cache całych stron

Słyszałeś(aś) pewnie o wtyczce WP-SuperCache. W wersji ekstremalnej buforuje ona całe strony tak, że do gościa trafia wersja odczytana bezpośrednio z pliku. Możemy i u siebie zrobić coś podobnego. [;

Idea jest dość prosta, wręcz łopatologiczna. Zakładam, że mamy schemat linków /dzial, strony zmieniają się bardzo rzadko. Przy każdym niezbuforowanym działaniu skryptu, cache’ujemy zawartość do pliku odpowiadającego strukturze linków, np. /dzial.htm. Kasujemy albo przy zmianie zawartości, albo przy pomocy bota uruchamianego przez crona. Jak wyglądałoby to przy Rewrite?

RewriteEngine On

RewriteCond %{REQUEST_URI} [^\./\\] [NC] RewriteCond %{REQUEST_URI}.htm -f [NC] RewriteRule ^(.+)$ $1.htm [L]

I gotowe. [;

pliki CSS/obrazki

Błąd często popełniany przez początkujących – linki są skonstruowane wg konwencji katalogowej, np. dzial/strona. Na stronie głównej (nie zawsze, zależy ;)) wszystko jest ok, ale w poddziałach już znika formatowanie, obrazki również się nie wyświetlają.

Zacznijmy od przyczyny. Ustalmy jedną kwestię – przeglądarka NIE WIE, że strona używa przepisywania adresów. Łapiesz? Ok, inaczej – na stronie ścieżkę do CSS masz podaną mniej więcej tak: css/style.css. Gdy otworzysz stronę dzial, przeglądarka szuka stylu CSS w katalogu dzial/css/style.css.

Rozwiązań jest kilka, najpierw skrytykuję najgorsze. Mianowicie niektórzy piszą reguły tak, żeby w każdym z tych pseudokatalogów istniał plik ze stylami/obrazki. Niby wszystko działa, ale… Pozostaje jeszcze kwestia transferu. Otóż przy takim rozwiązaniu problemu przeglądarka pobiera ten sam plik OSOBNO dla każdego działu. O cache można raczej pomarzyć.

Natomiast jeśli chodzi o poprawne rozwiązania, to istnieją dwa:

korzystanie z tagu <base />
ścieżki bezwzględne

np. http://example.org/css/style.css albo /css/style.css

Które lepsze? Do wyboru, do koloru. Osobiście preferuję drugie, a to z powodu, że stosuję czasem linki względne do podstrron.

problemy z Light/Thick/Grayboxem i wyświetlaniem obrazków

Zacznijmy od tego, w jaki sposób *box w ogóle działa. Cała maszyneria podpinana jest tak, że typ otwieranej zawartości jest ustalany na podstawie rozszerzenia. Jeśli nie ma go podanego – zazwyczaj skrypt tworzy <iframe /> o sztywnych wymiarach. Czym to skutkuje – nie muszę mówić – obcięte zdjęcia, brak możliwości skorzystania z opcji galerii/pokazu slajdów.

Jeśli na stronie zdjęcia posiadają ścieżki w konwencji /galeria/zdjecia/tytul-1, to nie ma się czemu dziwić – *box nie sprawdza MIME zawartości i wrzuca wszystko do jednego wora – jakby to była zwyczajna strona. Dlaczego? Ano brak rozszerzenia pliku. Co z tym zrobić?

Zmodyfikować regułki tak, aby nazwy zdjęć kończyły się rozszerzeniem albo…
zmienić skrypt *boksa. Dodajemy własne reguły sprawdzania zawartości (np. wyrażenie regularne na URL).

Drugie rozwiązanie wymaga znajomości skryptu, w dodatku – przy najbliższej aktualizacji *boksa będziemy musieli zabrać się do roboty od nowa…

zmuszenie formularzy do korzystania z przyjaznych URL-i

Wszystko pięknie działa, adresy iście jedwabiste, ale masz formularz wyszukiwarki na stronie, szukasz, a tu w adresie paskudne ?query=fraza. Myślisz, co jest grane, przecież przepisywanie działa ok, szukanie niekoniecznie, ale na Wrzucie tak robią i jakoś działa. Ok, wyłącz JavaScript i spróbuj jeszcze raz. Też działa? No widzisz.

Zacznijmy od naprawienia zwykłego formularza. Masz flagę [QSA] na końcu regułek? ;]

RewriteRule WZORZEC ZAMIENNIK [QSA]

Bez tej flagi nie zadziała. Jeśli chodzi o przyjazne URL a’la wrzuta, to bez pomocy JS nie da się osiągnąć czegoś takiego, aby zapytanie było przekierowywane bezpośrednio do URL /szukaj/fraza. Jeśli jednak jesteś uparty(a), żeby skorzystać z takiego ułatwiacza, to skorzystaj z mniej więcej takiego kodu:

Ale to nie zmienia faktu, że nie wszyscy mają włączony JS.

epilog

Nad notką spędziłem parę ładnych godzin, a że ostatnio pewne osoby są łase na treść dla celów SEO, jestem zmuszony zrezygnować z Creative-Commons przynajmniej dla tej notki. Chcesz opublikować – skontaktuj się ze mną, nie będę tolerować samowolki.

Nie wszystko zdążyłem zweryfikować – komentarze i uwagi są – jak zwykle – mile widziane.

27.07.2009 @ 00:12 :: Internet,Tworzenie WWW,Tworzenie WWW - PHP
komentarzy 38

Tagi: apache, hosting, httpd, php, Rewrite, SEO, skrypty
wykop.pl OnMedia.pl

38 komentarzy

dopisz swój :: trackback :: RSS z komentarzami

Pingback eRIZ’s weblog » mod_rewrite – (pozornie) beznadziejne problemy, które można rozwiązać — 27.07.2009 @ 08:18

[…] link: eRIZ’s weblog » mod_rewrite – (pozornie) beznadziejne problemy, które można rozwiązać Share and […]
1.
- link
- cytuj
- www
Skomentowany przez MatheW — 27.07.2009 @ 08:30

Bardzo dobry wpis, kilka na prawdę ciekawych rozwiązań ;]
2.
- link
- cytuj
- www
Skomentowany przez sinx — 27.07.2009 @ 13:18

Przypuszczam, że artykuł jest bardzo ciekawy (chwilowo nie mam czasu go przeczytać), ale nasunał mi się jeszcze jeden przypadek który nie jest opisany, a jest dosyć powszechny mianowicie katalogi użytkowników na serwerze bez tyldy, dla domyślnej konfiguracji apache2 (Debian/Ubuntu) wygląda to tak:

UserDir /home/*/public_html

RewriteEngine on
RewriteCond /home/$1/public_html$2 -f [OR]
RewriteCond /home/$1/public_html$2 -d
RewriteRule ^/([^/]+)(.*) /home/$1/public_html$2

Całość umieszczamy w pliku z defaultowym vhostem. Źródło: http://caffeinated-geek.com/blog/?p=133
3.
- link
- cytuj
- www
Skomentowany przez eRIZ — 27.07.2009 @ 13:38

Ekhm, a nie lepiej przekonfigurować mod_userdir, żeby korzystał z adresów bez tyldy…?

http://httpd.apache.org/docs/1.3/mod/mod_userdir.html
4.
- link
- cytuj
- www
Skomentowany przez Nowaker — 27.07.2009 @ 22:43

Ciekawy wpis. Dodałem sobie go na listę wartościowych tematów i gdy przyjdzie mi wracać do mod_rewrite na pewno tutaj zawitam Teraz zaś chciałem skomentować Twoje zdanie, że poza niektórymi przypadkami nie ma to sensu. Nie zgodzę się, raczej odwróciłbym to zdanie – poza konkretnymi przypadkami nie ma sensu pisać w mod_rewrite. Najważniejsza jest wygoda – nie muszę ręcznie wpisywać mapowań w .htaccess, mając wsparcie mojego frameworka. Każdy moduł, który dostarcza jakąś treść, dołącza do routera swoje reguły routingu. Jeśli jest wygodnie, jest mniej problemów, czyli potencjalnych błędów. Mówię przez pryzmat swoich doświadczeń i potrzeb, na pewno jestem więc stronniczy

Co do wydajności, wszystkie napisane przeze mnie dotąd aplikacje mają mapowane adresy przez framework. Wydajnościowo tylko zyskuję – bałaganiarsko napisane GeoZone.pl (słaby kod, mod_rewrite) działa wolniej od aplikacji MVC ze starannie wydzielonymi warstwami i jak największą abstrakcją. Pewnie z tego samego powodu implementacja Ruby w Javie jest szybsza (średnio dwukrotnie) od implementacji Ruby w C. Ciężko zapanować nad kolejnymi komponentami systemu i tak się to wali. Ręczne pisanie regułek dla mod_rewrite to kolejna zbędna czynność.

Może jestem zboczony, ale napisanie prostej rzeczy na kilkadziesiąt linijek pakuję w framework. Bo dlaczego nie miałbym tego robić? Po 10 minutach pisania okaże się, że albo muszę albo napisać coś sam albo użyć gotowca z frameworka…

Może i trochę nie na temat… Ale co tam ;-]

P.S. Nie podoba mi się pojęcie „przepisywać”. Wolę używać słowa „mapować”.
5.
- link
- cytuj
- www
Skomentowany przez Custom — 29.07.2009 @ 06:30

Takich wpisów na blogach jest mało
Dzięki Ci za ten
6.
- link
- cytuj
- www
Skomentowany przez WebCM — 05.08.2009 @ 11:02

Bardzo dobry artykuł – 6+. Mam pomysł na przyjazne URL na serwerach bez mod_rewrite. Ograniczeniem jest system plików. Przykład: /artykuly/nice_url. Sposób jest praktyczny raczej tylko wtedy, gdy generujemy statyczne strony, chociaż w przypadku dynamicznie generowanych (gdy przy każdym żądaniu trzeba odpalić parser PHP) też da się go zastosować (wymaga więcej operacji).
7.
- link
- cytuj
- www
Skomentowany przez eRIZ — 05.08.2009 @ 11:26

Dzięki wszystkim. :]

~Nowaker – przy małych projektach po prostu nie używam frameworków – jak wystarczy mi prosty dostęp do bazy przez PDO, nawet strukturalnie wtedy leci. ;]

~Custom – takich, czyli? :>

~WebCM – najlepiej wtedy zmienić hosting na inny. Osobiście nie bawię się w coś takiego, że serwer na moje aplikacje nie miałby Rewrite. mod_rewrite, to teraz standard, nie ma sensu bawić się w takie obejścia.

(gdy przy każdym żądaniu trzeba odpalić parser PHP) też da się go zastosować (wymaga więcej operacji).

Nie. Robi się inny myk – plik bez rozszerzenia i do niego wstrzykuje żądania. Jednak jak już napisałem – takie obejścia nie mają sensu, MR to niezbędne minimum; Świat trzeba ulepszać tam, gdzie się da. ;]
8.
- link
- cytuj
- www
Pingback eRIZ’s weblog » Paul van Dyk — 06.09.2009 @ 23:24

[…] wszak odpoczynek też potrzebny. Miałem pisać notkę podobnego kalibru jak wcześniejsza o mod_rewrite (spokojnie, nie ucieknie ;)), ale dzisiaj przeczytałem coś, co mnie co najmniej […]
9.
- link
- cytuj
- www
Skomentowany przez slawek — 18.09.2009 @ 17:49

CZesc, a co z takimi adresami: http:///www.domena.pl/var//var/. Jezeli ktoras z danych jest pusta to wtedy nie dziala. Jak sobie z tym poradzić?
10.
- link
- cytuj
Skomentowany przez Michał — 24.10.2009 @ 08:54

przykład z wildcard nie działa
11.
- link
- cytuj
Pingback eRIZ’s weblog » Cache danych - czym, jak, gdzie i kiedy - cz. I: teoria — 11.11.2009 @ 00:41

[…] jest to świetne rozwiązanie. W przypadku odpowiedniego wykorzystania mod_rewrite, o czym już pisałem, wysłaniem dokumentu do przeglądarki zajmuje się wyłącznie serwer, już z pominięciem […]
12.
- link
- cytuj
- www
Skomentowany przez Flanker — 12.12.2009 @ 13:15

Niesamowicie przydatny artykuł dla początkujących takich jak ja. Dzięki wielkie.

Pozdrawiam
13.
- link
- cytuj
- www
Skomentowany przez Bartas — 08.01.2010 @ 00:00

Witam,

Trafiłem przypadkiem na twój opis z mod_rewritem bo walczyłem z pewnym problemem przepisywania adresow gdzie różnił sie tylko koncowym parametrem . Udało sie , dzieki twoim opisanym poradą.

Tak trzymac, bede częsciej zagladał może cos jeszcze bardziej ciekawego napiszesz

pozdrawiam Bartek
14.
- link
- cytuj
- www
Skomentowany przez magda — 04.06.2010 @ 22:39

Bardzo fajny artykuł, dzięki zań Przepraszam za odgrzewanie tematu i tą prośbę o pomoc w miejscu nie do końca na to przeznaczonym, ale od dwóch dni bez ustanku czytam o mod rewrite, wypróbowałam naprawdę dziesiątki przykładów z dziesiątek stron i zaczynam sądzić, że coś ze mną nie tak… Próbuję przekształcić banalne dynamiczne adresy (http://mojastrona.wodip.opole.pl/index.php?strona=costam i http://mojastrona.wodip.opole.pl/index.php?strona=$costam&pokaz_strone=$2) w równie sztampowe przyjazne (http://mojastrona.wodip.opole.pl/$costam i http://mojastrona.wodip.opole.pl/$costam/$2). Korzystałam już nawet z generatora mod rewrite. Nadal nie uzyskałam pożądanego efektu. Po tych wszystkich próbach udało mi się jedynie wyeliminować z adresu www i index.php.
RewriteEngine On RewriteBase / RewriteCond %{HTTP_HOST} ^www\.spdobrzyn\.wodip\.opole\.pl$ [NC] RewriteRule ^(.*)$ http://spdobrzyn.wodip.opole.pl/$1 [L,R=301] RewriteCond %{THE_REQUEST} \ /(.+/)?index\.php(\?.*)?\ [NC] RewriteRule ^(.+/)?index\.php$ /%1 [NC,R=301,L]

?strona= i ?pokaz_strone= trwają dzielnie na swoich stanowiskach i ani w głowie im się wynosić. Będę bardzo wdzięczna za przywrócenie mi możliwości zaśnięcia przed piątą rano
15.
- link
- cytuj
Skomentowany przez Kiu35 — 01.07.2010 @ 09:04

Witam,

Mam stronę pod adresem: http://www.domena.pl i http://www.domena.se, która jest przetłumaczona na 4 języki. Chciałbym, aby po wpisaniu domeny http://www.domena.se pojawił się serwis w szwedzkiej wersji językowej.

Dodam, że strona oparta jest o system CMS. Wersja szwedzka ma adres http://www.domena.pl/?sLang=se lub http://www.domena.se/?slang=se

Jak powinien wyglądać plik .htaccess?
16.
- link
- cytuj
Skomentowany przez eRIZ — 22.07.2010 @ 21:39

Uhm, ale po co do tego htaccess? Przecież jak masz obie domeny pod ten sam skrypt, to router odpowiednio dobierze wersję adekwatnie do hosta.
17.
- link
- cytuj
- www
Skomentowany przez Krzysiek Mortka — 28.08.2010 @ 17:21

Świetny artykuł, gratulacje! Od siebie tylko dodam, że jeśli ktoś przy przekierowaniu chce pozbyć się Query Stringa może to zrobić na końcu dodając znak zapytania, np.:
RewriteCond %{QUERY_STRING} ^go=news&mode=read&nid=(\d+)$ [NC] RewriteCond %{REQUEST_URI} !^/news/id/(\d+)(/?)$ [NC] RewriteRule . http://mortka.pl/news/id/%1/? [R=301,L]

Krzysiek
Pozdrawiam
18.
- link
- cytuj
- www
Skomentowany przez mrJaros — 05.11.2010 @ 14:48

Witam. Dzięki za ciekawy wpis i za ogólnie świetny blog. Mam niestety mały problem, którego nie potrafię obejść – może tutaj ktoś będzie wiedział jak to załatwić. A mianowicie:
miałem do tej pory linki w postaci index.php?dzial=produkty&kat=#
gdzie # – id kategorii. Wszystko działa fajnie, mam teraz ten sam link w postaci /produkty/#
Tylko teraz powstaje pytanie, czy istnieje możliwość aby zamiast # była nazwa kategorii pobrana z bazy? Chodzi o to, że np w tabeli kategorie mam kolumny id, nazwa. Kategoria o id 9 ma atrybut nazwa np „Swetry”. W związku z tym, obecnie mam link /kategorie/9. Zależy mi, aby był to link kategorie/swetry (oczywiście pod swetry ma się kryć id kategorii, a więc 9). Any ideas?
19.
- link
- cytuj
Skomentowany przez eRIZ — 05.11.2010 @ 16:03

Thx.

Cóż, bez zmiany skryptu się nie obędzie – na to nie ma jedynej, uniwersalnej rady; napisałem o tym w http://eriz.pcinside.pl/weblog/mod_rewrite-pozornie-beznadziejne-problemy-ktore-mozna-rozwiazac-208.html#t5 – punkt 2. W praktyce, musisz znaleźć kod odpowiedzialny za generowanie linków oraz przetwarzanie żądań, dopiero wtedy można coś więcej mówić.
20.
- link
- cytuj
- www
Skomentowany przez mrJaros — 06.11.2010 @ 10:18

A więc u mnie to wygląda tak:

//GENEROWANIE LINKÓW:
$sql=”SELECT k.id, k.kategoria, count( p.id ) AS ile
FROM kategorie k, produkt p
WHERE p.kategoria = k.id and k.szef is null
GROUP BY k.kategoria”;
$wynik = mysql_query($sql,$polaczenie);
while($pozycja=mysql_fetch_array($wynik)){
…
…
echo „„.$pozycja[kategoria].”(„.$pozycja[ile].”)„;

//PRZETWARZANIE ŻĄDAŃ:
…
if(isset($_GET[kat])){
$sql=”select * from produkt where kategoria=”.$_GET[kat].” ORDER BY id DESC LIMIT „.$start.”,”.$prod_str.”;”;
…
$wynik = mysql_query($sql,$polaczenie);
while($pozycja=mysql_fetch_array($wynik)){
//generowanie div-ów z produktami
}

Mam nadzieję że o to chodziło. Czyli trzeba przerobić skrypt tak, żeby pobierał z bazy te produkty, dla których nazwa kategorii=”Swetry”, a nie id kategorii=9? Dobrze rozumiem?
21.
- link
- cytuj
Skomentowany przez motyś — 23.12.2011 @ 00:59

Zajebisty art =)
22.
- link
- cytuj
- www
Skomentowany przez Mike — 02.02.2012 @ 09:27

Mam problem z przekierowaniem „całkowitym”. Jak zrobić aby „brzydki adres” nie był już dostępny. W .htaccess mam takie reguły
Options +FollowSymlinks RewriteEngine on RewriteCond %{REQUEST_URI} ^\/index.php$ RewriteCond %{QUERY_STRING} ^$ RewriteRule ^(.*)$ http://domena.pl? [L,R=301] RewriteRule ^test/1?$ index.php?pid=1 [L]Problem polega na tym, ze jak fizycznie wpisze index.php?pid=1 to jest to samo co test/1, a chciałbym, aby jak ktos wpisze index.php?pid=1 to przekieruje na test/1. Póki co oba adresy sa dostepne.
Ktoś wie w czym jest problem?
23.
- link
- cytuj
Pingback Techniczna optymalizacja serwisu czyli SEO | blog o projektowaniu stron i e-marketingu — 23.04.2012 @ 09:27

[…] Przyjazne adresy można uzyskać przy pomocy pliku .htaccess i komendy mod_rewrite. Dużo informacji znajdziesz w sieci. Natomiast ja polecam ten wpis o mod_rewrite. […]
24.
- link
- cytuj
- www
Skomentowany przez PS — 17.05.2012 @ 13:23

Świetny artykuł! Dzięki!
25.
- link
- cytuj
- www
Skomentowany przez Arbre — 07.08.2012 @ 11:47

Hejka,
świetny artykuł, brakuje jedynie opcji druku, może prosty konwerter do pdf?
26.
- link
- cytuj
- www
Skomentowany przez deha21 — 17.09.2012 @ 16:42

Fajne rozwiązanie jest z wildcard. Chciałbym tylko aby adres domeny „zatrzymywał się” w pasku adresu. Na przykład, po wpisaniu xxx.mojastrona.pl chce zeby ladowala sie zawartosc mojastrona.pl/pliki/xxx ale żeby na pasku adresu nadal widniał adres xxx.mojastrona.pl. W tej chwili przekierowuje mnie do mojastrona.pl/pliki/xxx a wygląda to troche brzydko
27.
- link
- cytuj
Skomentowany przez eRIZ — 17.09.2012 @ 20:25

Zapomnij – robię sobie stronkę X z formularzem podobnym do logowania w banku, ale stwierdzam, że jest „brzydko” i podstawiam do paska adresu „bank.pl”. Prawda, że ładnie? [;
28.
- link
- cytuj
- www
Skomentowany przez deha21 — 17.09.2012 @ 22:27

Sugerujesz ze chce wyłudzać dane od użytkowników?
Chce zrobić po prostu coś a’la wizytówki internetowe dla swoich klientów, z moją domeną. Po wpisaniu xxx.mojadomena.pl oczywiście strona się ładuje ale potem zostaje brzydki adres – mojadomena.pl/katalog/strony/klient. Musi się dać zrobić żeby „adres zostawał”.
29.
- link
- cytuj
Skomentowany przez eRIZ — 17.09.2012 @ 23:29

Nie sugeruję, tylko informuję, dlaczego się nie da zrobić tego, co chcesz osiągnąć. Pozostaje wyłącznie wildcard.
30.
- link
- cytuj
- www
Skomentowany przez deha21 — 18.09.2012 @ 10:00

Wlasnie o wildcard mi chodzi. Mam włączone i zrobiłem te przekierowanie z przykładu wyżej. Działa tylko, że chciałbym żeby dalej zostawał adres xxx.mojadomena.pl Bo teraz pokazuje mi mojadomena.pl/pliki/strony/xxx
31.
- link
- cytuj
Skomentowany przez sajuuk — 19.02.2013 @ 21:40

Witam.
Mam mały problem z wymuszeniem httpsa i prosiłbym o pomoc. Raczkuję w regułach więc proszę o wyrozumiałość Swoją drogą rozwiązanie mogłoby być uzupełnieniem artykułu.
Otóż na serwerze ma założone podkatalogi, na które przekierowane są subdomeny czyli np test.domena.pl fizycznie odpala skrypt w katalogu test. Ponieważ nie mam i mieć nie będę wildcarda to przekierowanie takie realizuję za pomocą takich reguł.

RewriteEngine on
RewriteBase /
RewriteCond %{HTTP_HOST} ^(www\.)?test\.domena\.pl$ [NC]
RewriteCond %{REQUEST_FILENAME} !/test/
RewriteRule ^(.*)$ /test/$1 [L]

RewriteCond %{HTTP_HOST} ^(www\.)?test2\.domena\.pl$ [NC]
RewriteCond %{REQUEST_FILENAME} !/test2/
RewriteRule ^(.*)$ /test2/$1 [L]

I teraz pojawia się problem. Kupiłem certyfikat SSL i chciałbym przekierować wszystkie subdomeny na httpsa. Nie wiem jak sobie z tym poradzić. Chodzi o to że jak user zażąda strony test.domena.pl to przerzuci go na https://test.domena.pl a dalej jak powyżej czyli na katalog test.
Jak zażada test2.domena.pl to przerzuci go na https://test2.domena.pl a dalej jak powyżej czyli na katalog test2 itd. Goglowałem, próbowałem ale coś mi nie idzie.
Próbowałem
RewriteCond %{HTTPS} !^on$
RewriteRule ^(.*)$ https://domena.pl/$1 [R=301,L]
ale coś nie tak bo przecież nie na główną domenę chciałem.
Będę wdzięczny za pomoc (adres na który słać flaszkę proszę na maila :)).
32.
- link
- cytuj
Skomentowany przez andeo — 10.04.2013 @ 15:20

Witam,
trochę jestem początkująca w tym temacie, więc z góry przepraszam, ale mam problem z linkami bezpośrednimi do podstron. Domyślam się, że to może chodzić o mod-rewrite ale kompletnie nie wiem jak to ugryźć.
Mam stronę na wordpressie, niezależnie od wejścia na jakąś podstronę lub post ale w pasku adresowym pozostaje niezmiennie adres mojej strony http://www.moja_strona.pl a nie np.: http://www.moja_strona.pl/nazwa_postu_lub_jakis_ciag_znaków.
Będę wdzięczna za pomoc lub jakąś wskazówkę.
33.
- link
- cytuj
Pingback eRIZ’s weblog » mod_rewrite - (pozo... — 26.11.2013 @ 23:34

[…] eRIZ’s weblog » mod_rewrite – (pozornie) beznadziejne problemy, które można… From eriz.pcinside.pl – Today, 11:34 PM PHP, webdesign, Linux, Windows i inne – bo nie samym chlebem człowiek żyje… Bartosz Mężyński’s insight: […]
34.
- link
- cytuj
- www
Skomentowany przez Marian — 17.02.2014 @ 13:12

Dobrze ale jak zamienić taki adres

szukaj.html?szukaj=test&gdzie=kategoria1

na index.php?nazwa_strony=szukaj&szukaj=test&gdzie=kategoria1

za pomocą htacces?
35.
- link
- cytuj
- www
Skomentowany przez Marian — 17.02.2014 @ 13:22

teraz mam taki kod:

Options -Indexes
RewriteEngine On
RewriteBase /Projekty/pretty_stories/

RewriteCond %{REQUEST_FILENAME} !-f
RewriteCond %{REQUEST_FILENAME} !-d

RewriteRule ^([0-9A-Za-z\-\_]+)(\.html|[/])?$ index.php?nazwa=$1 [L,NC]

ale ucina mi dane przesyłane metodą get
36.
- link
- cytuj
- www
Skomentowany przez Deser — 10.09.2014 @ 17:07

Gdyby nie te kretyński minki typu „;]” to może bym zniósł ten artykuł do końca…
37.
- link
- cytuj
Skomentowany przez krzys77 — 24.10.2019 @ 20:21

Witam
Przepraszam że zawracam głowe pewnie bzdurą ale nie moge sobie z tym dac rady
Poprzebuje przekierować w plikuhtaccess z adresy https://test.nazwa.net na https://nazwa.net/nazwa2/nazwa3
i zamaskować ten adres aby nadal w przeglądarce po przekierowaniu wyświetlał się nadal test.nazwa.net
Udało mi się przekierować takim wpisem
RewriteCond %{HTTP_HOST} ^test.krzys.net
RewriteRule ^(.*)$ https://krzys.net/wordpress2/test/$1 [L]

ale nie potrafię zamaskować adresu strony. Prosze o pomoc
38.
- link
- cytuj

RSS z komentarzami :: trackback

Skomentuj

Możesz używać znaczników XHTML. Dozwolone są następujące tagi: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong> <pre lang="" line="" escaped="" cssfile="">

Wszystkie komentarze przechodzą przez moderację oraz filtry antyspamowe. Nie zostanie opublikowany komentarz, jeśli:

Jego treść obraża kogokolwiek.
W treści znajdują się wulgaryzmy i słownictwo ogólnie uznane za nieprzyzwoite.
Mam wątpliwości co do autora wpisu (Wszelkie anonimy są kasowane - niezależnie od zawartości - wpisz prawdziwy e-mail. Jeśli usunąłem, Twoim zdaniem, komentarz niesłusznie - daj znać). Zdarza się, iż sprawdzam kim jest komentujący.
Zawiera jakąkolwiek formę reklamy.

Warning: Undefined variable $user_ID in /usr/home/er1zpl/domains/eriz.pcinside.pl/public_html/weblog/wp-content/themes/inBlueDiary/comments.php on line 112

nick (wymagany)

adres e-mail

strona www (opcjonalnie)

mod_rewrite – (pozornie) beznadziejne problemy, które można rozwiązać

Czyżby?

Z kopyta

A nie łatwiej…?

podstawowe praktyczne zastosowania

Banowanie po IP

Blokada przed hotlinkowaniem

www, czy nie www?

wymuszanie szyfrowania połączenia

z ukośnikiem na końcu, czy bez?

częste pomyłki

sprytne rozwiązania dzięki mod_rewrite

Wydzielenie katalogu public_html

wirtualne subdomeny

jeden serwis, podobne domeny – wiele języków

przypadki beznadziejne – wyższa szkoła jazdy

przetwarzanie ciągu po znaku zapytania

przepisywanie adresu ze znakami specjalnymi

negocjacja zawartości bezpośrednio w Rewrite

implementacja rzecz straszna – strona i skrypty

łatwe i szybkie generowanie identyfikatorów przyjaznych dla URL

łatwe korzystanie z cache całych stron

pliki CSS/obrazki

problemy z Light/Thick/Grayboxem i wyświetlaniem obrazków

zmuszenie formularzy do korzystania z przyjaznych URL-i

epilog

38 komentarzy

Skomentuj

Szufladka

Tagi

Inne dzienniki

Linki autora

Zaglądam

Kategorie

Losowe wpisy

Najnowsze wpisy

Archiwa

Przemysław "eRIZ" Pawliczuk

Kalendarz

Szukaj

Licencja