Regulární výrazy v Google Analytics

Regulární výrazy jsou kouzlo, které vám ušetří spoustu práce a umožní dělat věci doposud nevídané. Nepřeháním, posuďte sami.

Regulární výrazy Google Analytics, ilustrační obrázek.

V prvním díle miniseriálu o filtrech v Google Analytics jsme regulární výrazy naťukli. Co to je? Jde o sadu pravidel, která umožňují pracovat s řetězci znaků. Umožňují tak tvorbu jednoduchých i promyšlených pravidel. V Google Analytics se s regulárními výrazy setkáte na řadě míst. V případě filtrů je lze využít jednak k nahrazování znaků a popisu množin znaků, jednak k práci s proměnnými.

Seznam regulárních výrazů v Google Analytics

Uvedu vždy znak a popis jeho významu:

  • . zastupuje jeden libovolný znak,
  • * nalézá shodu s žádnou nebo několika předchozími položkami,
  • + nalézá shodu s jednou nebo několika předchozími položkami,
  • ? nalézá shodu s žádnou nebo jednou předchozí položkou,
  • () obsah závorek jako jedna položka,
  • [] nalézá shodu s jednou položkou v seznamu,
  • – vytvoří rozsah v seznamu,
  • | nebo,
  • ^ nalézá shodu od začátku pole,
  • $ nalézá shodu od konce pole,
  • \ deaktivuje výše uvedené zástupné znaky.

Úplný přehled podporovaných regulárních výrazů najdete v nápovědě Google Analytics. Dejte si pozor, nápověda často pracuje s překladem termínu: obvyklé výrazy.

Tipy pro práci s regulárnímy výrazy

Uplatnění regulárních výrazů je široké. Pro začínající uživatele přikládám několik tipů:

  • Jeden znak zastoupí ., libovolný počet znaků pak zastoupí kombinace znaků .*.
  • Dejte si pozor na znaky . a - v URL. Jde o zástupné znaky. Vždy je proto doplňte o zpětné lomítko, které je zbaví jejich řídícího významu. Zápisy tak budou vypadat např.: muj\-web\.cz.
  • Pokud řetězec v poli být může a nemusí, použijte znak ?. Zápis domény web.cz s i bez www na začátku, tak zapíšete následovně: (www\.)?web\.cz.

Jak vyparsovat z řetězce proměnnou

Pomocí regulárních výrazů můžeme také získat proměnnou z řetězce. Ukažme si to na příkladu. Řekněme, že na vstupu máme URL odkazujícího zdroje ve tvaru: web.cz/?parametr1=hodnota&parametr2=hodnota. Našim cílem je získat z URL hodnotu parametr2 a dále s ní pracovat. Aby to nebylo jednoduché, parametr1 může nabývat různých hodnot.

Do pole A nového filtru Google Analytics doplníme: /?parametr1=(.*)&parametr2=(.*).

Regulární výraz (.*) představuje libovolný počet libovolných znaků a mohou se tedy měnit. Zároveň je možno s jejich obsahem dále pracovat.

Do pole Výstup uvedeme: $A2

Písmeno A označuje pole filtru (výše uvedené pole A) a číslo pořadí (.*). Takto přiřadíme hodnoty parametru parametr2 z našeho příkladu libovolné metrice Google Analytics.

Tip: Regulární výrazy podporuje řada jiných aplikací. Pokud si je osvojíte, dokážete nevídané například s editorem jEdit. Složité úpravy klíčových slov se s ním stanou hračkou.

V příštím díle seriálu o filtrech Google Analytics si povíme jak do přehledů zahrnout výhradně vlastní web.

Komentáře ke článku Regulární výrazy v Google Analytics
František Štrupl (bez ověření) 24. 11. 2009 11:19
Ahoj Michale, v regulárním výrazu /?parametr1=(.)¶metr2=(.) vkládaném do pole A ti chybí znaky \*. Správně by mělo být /?parametr1=(.\*)¶metr2=(.\*).
Michal Janík 24. 11. 2009 13:24
Díky za upozornění. Ty hvězdičky v regulárním výrazu byly, ale Texy je "schovalo".
Miroslav Pecka (bez ověření) 4. 12. 2009 22:58

Dovolím si upozornit (a udělat malou reklamu;-)) na web Regulární výrazy.
Někomu se se třeba http://www.regularnivyrazy.info/shrnuti-syntaxe.html mohlo hodit.

Anička (bez ověření) 10. 5. 2011 17:34
Sice opožděně, ale děkuji za tabulky, jsou perfaktní a hodí se :)
Poslat nový komentář
Obsah tohoto pole je soukromý a nebude veřejně zobrazen.
fialo_á: