Regulární výrazy jsou kouzlo, které vám ušetří spoustu práce a umožní dělat věci doposud nevídané. Nepřeháním, posuďte sami.
V prvním díle miniseriálu o filtrech v Google Analytics jsme regulární výrazy naťukli. Co to je? Jde o sadu pravidel, která umožňují pracovat s řetězci znaků. Umožňují tak tvorbu jednoduchých i promyšlených pravidel. V Google Analytics se s regulárními výrazy setkáte na řadě míst. V případě filtrů je lze využít jednak k nahrazování znaků a popisu množin znaků, jednak k práci s proměnnými.
Seznam regulárních výrazů v Google Analytics
Uvedu vždy znak a popis jeho významu:
. zastupuje jeden libovolný znak,
* nalézá shodu s žádnou nebo několika předchozími položkami,
+ nalézá shodu s jednou nebo několika předchozími položkami,
? nalézá shodu s žádnou nebo jednou předchozí položkou,
() obsah závorek jako jedna položka,
[] nalézá shodu s jednou položkou v seznamu,
– vytvoří rozsah v seznamu,
| nebo,
^ nalézá shodu od začátku pole,
$ nalézá shodu od konce pole,
\ deaktivuje výše uvedené zástupné znaky.
Úplný přehled podporovaných regulárních výrazů najdete v nápovědě Google Analytics. Dejte si pozor, nápověda často pracuje s překladem termínu: obvyklé výrazy.
Tipy pro práci s regulárnímy výrazy
Uplatnění regulárních výrazů je široké. Pro začínající uživatele přikládám několik tipů:
Jeden znak zastoupí ., libovolný počet znaků pak zastoupí kombinace znaků .*.
Dejte si pozor na znaky . a - v URL. Jde o zástupné znaky. Vždy je proto doplňte o zpětné lomítko, které je zbaví jejich řídícího významu. Zápisy tak budou vypadat např.: muj\-web\.cz.
Pokud řetězec v poli být může a nemusí, použijte znak ?. Zápis domény web.cz s i bez www na začátku, tak zapíšete následovně: (www\.)?web\.cz.
Jak vyparsovat z řetězce proměnnou
Pomocí regulárních výrazů můžeme také získat proměnnou z řetězce. Ukažme si to na příkladu. Řekněme, že na vstupu máme URL odkazujícího zdroje ve tvaru: web.cz/?parametr1=hodnota¶metr2=hodnota. Našim cílem je získat z URL hodnotu parametr2 a dále s ní pracovat. Aby to nebylo jednoduché, parametr1 může nabývat různých hodnot.
Do pole A nového filtru Google Analytics doplníme: /?parametr1=(.*)¶metr2=(.*).
Regulární výraz (.*) představuje libovolný počet libovolných znaků a mohou se tedy měnit. Zároveň je možno s jejich obsahem dále pracovat.
Do pole Výstup uvedeme: $A2
Písmeno A označuje pole filtru (výše uvedené pole A) a číslo pořadí (.*). Takto přiřadíme hodnoty parametru parametr2 z našeho příkladu libovolné metrice Google Analytics.
Tip: Regulární výrazy podporuje řada jiných aplikací. Pokud si je osvojíte, dokážete nevídané například s editorem jEdit. Složité úpravy klíčových slov se s ním stanou hračkou.
V příštím díle seriálu o filtrech Google Analytics si povíme jak do přehledů zahrnout výhradně vlastní web.
Komentáře ke článku Regulární výrazy v Google Analytics
Ahoj Michale, v regulárním výrazu /?parametr1=(.)¶metr2=(.) vkládaném do pole A ti chybí znaky *. Správně by mělo být /?parametr1=(.*)¶metr2=(.*).
Michal Janík pracuje jako konzultant marketingu na internetu. Aktivně se věnuje analýze výkonnosti webů a spolupracuje na nich od prvních návrhů až po vylepšování obchodních procesů fungujících internetových stránek.
Ahoj Michale, v regulárním výrazu /?parametr1=(.)¶metr2=(.) vkládaném do pole A ti chybí znaky *. Správně by mělo být /?parametr1=(.*)¶metr2=(.*).
Díky za upozornění. Ty hvězdičky v regulárním výrazu byly, ale Texy je „schovalo“.
Dovolím si upozornit (a udělat malou reklamu;-)) na web Regulární výrazy.
Někomu se se třeba http://www.regularnivyrazy.info/shrnuti-syntaxe.html mohlo hodit.