Grep a megnevezett bemeneti fájlok -ban a megadott mintá -hoz illeszkedő sorokat keres. Amennyiben nincs bemenő fájlnév megadva, vagy az a - jel, a standard bemenetet olvassa. Alapértelmezés szerint grep a mintához illeszkedő sorokat kinyomtatja.
Három fő változata van a grep -nek, melyeket a következő opciókkal szabályozhatunk:
Létezik továbbá két programváltozat: egrep és fgrep . Egrep hasonló, de nem azonos grep -E , -vel és kompatíbilis a történelmi Unix egrep -pel. Fgrep azonos grep -F -fel.
A grep minden változata megérti az alábbi opciókat:
A szabályos kifejezés egy minta, amely a stringeknek egy halmazát írja le. A szabályos kifejezések az aritmetikai kifejezésekhez hasonlóan konstruálhatók, azaz különböző operátorokkal kisebb kifejezésekből építhetők fel.
Grep kétféle változatát érti a szabályos kifejezések nyelvtanának (syntax): az ``alap'' (basic) és a ``bővített'' (extended) változatot. A GNU grep -ben nincs különbség a kétféle nyelvtan által elérhető funkciókban. Más megvalósításokban az alap szabályos kifejezések kevésbé hatékonyak. A következő leírás a bővített szabályos kifejezésekre vonatkozik; az alap reguláris kifejezéseknek ettől való különbségeit ezután összegezzük.
Az elemi építőkövek olyan szabályos kifejezések, melyek egyetlen karakterhez illeszkednek. A legtöbb karakter (pl. a betűk és a számok) szabályos kifejezések, melyek önmagukhoz illeszkednek. A speciális jelentéssel rendelkező metakarakterek (pl. a ., *, [ karakterek) elé backslash-t kell írni, hogy speciális jelentésük helyett a karakterhez való illeszkedést vizsgálhassuk. (Pl. a mintában levő \[ fog illeszkedik a szövegbeli nyitó szögletes zárójellel.)
A [ és ] jelek közé írt karakterlista illeszkedik a listában szereplő bármely karakterhez. Amennyiben a lista a ^ jellel kezdődik, az illeszkedés a listában nem szereplő karakterekkel áll fenn. Például a [0123456789] szabályos kifejezés bármely számjegyhez illeszkedik.
ASCII karakterek tartománya az első és utolsó karakterek megadásával adható meg, ha ezeket `-' jel választja el. (Pl. [a-f] ugyanaz, mint [abcdef].)
Végül a karakterek néhány speciális osztálya előre definiált névvel rendelkezik. (Ezen nevek jelentése angolul magától értetődő, itt kifejtjük őket.)
A legtöbb metakarakter elveszti speciális jelentését egy listán belül. Egy ] jelet a minta első elemeként szerepeltetve csatolhatunk a listához. Hasonlóan a ^ jel az első kivételével bármely helyre kerülve a `^' jelet fogja jelenteni. Végül a `-' jelet a lista utolsó elemeként kell írni, ha nem metakarakterként akarjuk értelmezni.
A pont ( . ) minden karakterhez illeszkedik. A \w szimbólum az [[:alnum:]] szinonímája, míg \W ugyanaz, mint [^[:alnum:]] .
A ^ és a $ jelek metakarakterek, melyek rendre a sorkezdő és -záró üres srtingekhez illeszkednek. Hasonlóan a \< és \> szimbólumok a szavak elejénél illetve végénél található üres stringhez illeszkednek. A \b a szóhatáron levő üres stringhez illeszkedik, míg \B a nem szóhatáron levő üres stringhez illeszkedik.
Az egy karakterhez illeszkedő szabályos kifejezéseket a következő ismétlési operátorok egyike követheti:
Két szabályos kifejezés összekapcsolható a | infix operátorral; a kapott szabályos kifejezés minden stringhez illeszkedik, amelyikhez valamelyik részkifejezés illeszkedik.
Az ismétlés nagyobb precedenciájú, mint az összefűzés, ami viszont a választóoperátornál (azaz |-nál) nagyobb precedenciájú. Egy részkifejezés zárójelbe tehető, hogy felülbíráljuk a precedenciát.
A \ n visszahivatkozást (backreference) jelöl, ahol n egy számjegy. Ez illeszkedik ahhoz a stringhez, amely a szabályos kifejezés ezt megelőző n -edik zárójeles alkifejezéshez illeszkedett.
Az alap szabályos kifejezésekben a ? , + , { , | , ( , és ) metakarakterek elvesztik speciális jelentésüket; helyettük a backslash-es változatukat kell használni: \? , \+ , \{ , \| , \( , és \) .
Az egrep programban a { metakarakter elveszti speciális jelentését, helyette a \{ használható.
Általában a kilépési állapot (exit status) 0, ha volt illeszkedés és 1, ha nem volt egyetlen illeszkedés sem. A -v opció megfordítja ennek értelmét.
A 2 kilépési állapot hibát jelez: nyelvtani hiba volt a mintában vagy elérhetetlen a bemeneti fájl, esetleg más rendszerhiba történt.
A hibajelentések e-mail-en a bug-gnu-utils@prep.ai.mit.edu . címre küldendők. Győződjön meg róla, hogy a ``grep'' szó szerepel valahol a ``Subject:'' mezőben.
Nagy ismétlési számok a { m , n } ismétlési operátorban nagy memóriafelhasználást eredményezhetnek. Továbbá néhány más bonyolult szabályos kifejezés exponenciálisan növő időt és tárhelyet követelhet, és azt eredményezheti, hogy a grep kifut a memóriából.
A visszahivatkozások nagyon lassúak és exponenciálisan növő futásidőt igényelnek.