From 379ea257f0f7a26884ca12b2c386224ca87e4f11 Mon Sep 17 00:00:00 2001 From: Victor Zamanian Date: Wed, 19 Nov 2008 17:19:00 +0100 Subject: [PATCH] Fixed all "Overfulls" (Underfulls remain), and figure/table references. --- rapport.tex | 50 ++++++++++++++++++++++++++++---------------------- 1 file changed, 28 insertions(+), 22 deletions(-) diff --git a/rapport.tex b/rapport.tex index d7c0cc1..7922768 100644 --- a/rapport.tex +++ b/rapport.tex @@ -130,10 +130,10 @@ för att utföra beräkningar. % http://sv.wikipedia.org/wiki/Turingmaskin Inspirerad av Turings arbete skapade sedan Warren McCulloch och Walter Pitts (1943) en förenklad modell för neuronen, se \cite{norvig} -kapitel 18. Stephen Cole Kleene definierade sedan (1951 och 1956) Ändlig -automation (Finite automation), Reguljära uttryck och påvisade deras -likhet. Både Reguljära uttryck och Finite automation är en del av den språktyp -som brukar kallas Reguljära språk, (Regular Language). +kapitel 18. Stephen Cole Kleene definierade sedan (1951 och 1956) ändlig +automation (Finite Automation) och reguljära uttryck och påvisade deras +likhet. Både reguljära uttryck och Finite Automation är en del av den språktyp +som brukar kallas \emph{reguljära språk}, (Regular Language). I \cite{speech} av Jurafski \emph{et al.} ger man ett exempel på hur Finite automation och Reguljära uttryck förhåller sig till @@ -148,8 +148,8 @@ Muuuu! ... \end{verbatim} -Detta skulle kunna beskrivas med en modell för \textbf{Finite-state - automation} (ändlig automat) enligt Figur \ref{fig:finauto}. +Detta skulle kunna beskrivas med en modell för \emph{Finite-state + automation} (ändlig automat) enligt Figur~\ref{fig:finauto}. \begin{figure}[H] \begin{center} @@ -160,11 +160,11 @@ Detta skulle kunna beskrivas med en modell för \textbf{Finite-state \end{figure} Tillstånden \verb!q0-q4! är de giltiga tillstånd som finns, \verb!q1! -är starttillståndet och \verb!q4! representerar sluttillstånd. Pilarna -i figuren markerar möjliga förflyttningar mellan tillstånden. +är start\-tillståndet och \verb!q4! representerar sluttillstånd. Pilarna +i figuren markerar möjliga för\-flyttningar mellan till\-stånden. Denna information går även att representera som en -\textbf{State-transition-tabell}, som i Tabell \ref{tab:statetranstable}. +\emph{State-transition-tabell}, som i Tabell~\ref{tab:statetranstable}. \begin{table}[h] \centering @@ -225,11 +225,12 @@ att beskriva till exempel början\slash slutet av ett ord och början\slash slutet av en hel sträng. Man kan också definiera teckenklasser som man vill inkludera i sitt uttryck, till exempel alla stora bokstäver, alla små bokstäver, siffror, eller till och med -vilken godtycklig kombination av tecken som helst. Här nedanför visas -en kort tabell med några texthändelser och deras motsvarande reguljära -uttryck. +vilken godtycklig kombination av tecken som helst. I +Tabell~\ref{tab:texthandelser} visas en kort tabell med några +texthändelser och deras motsvarande reguljära uttryck. -\begin{center} +\begin{table}[h] + \centering \begin{footnotesize} \begin{tabular}{|c|p{4cm}|l|l|l|} \hline @@ -249,7 +250,9 @@ uttryck. \verb!.! (punkt) & Står för vilket tecken som helst. & \verb!^.! & ''\textbf{t}ext'' \\ \hline \end{tabular} \end{footnotesize} -\end{center} + \caption{Texthändelser och deras motsvarande reguljära uttryck.} + \label{tab:texthandelser} +\end{table} Om man vill matcha en e-postadress i löpande text skulle man alltså vilja använda sig av \verb!\b! runt uttrycket för att markera att det @@ -271,10 +274,11 @@ samma teckenklass utan att behöva definiera en likadan klass för hela det antalet tecken vi vill matcha. Därför har man definierat något som kallas kvantifierare som gör att man kan bestämma hur många gånger man vill matcha en specifik klass, ett mönster eller bara ett tecken (så -kallade ''tokens''). Nedanstående tabell beskriver olika +kallade ''tokens''). Tabell \ref{tab:kvantifs} beskriver olika kvantifierare. -\begin{center} +\begin{table}[h] + \centering \begin{footnotesize} \begin{tabular}{|c|p{4cm}|l|p{4cm}|} \hline @@ -299,7 +303,9 @@ kvantifierare. nollor eller mer).\\ \hline \end{tabular} \end{footnotesize} -\end{center} + \caption{Reguljära kvantifierare, deras funktion och exempel på vad som matchas.} + \label{tab:kvantifs} +\end{table} Nu kan vi beskriva många olika variationer av mönster genom olika text\-händelser och kvantifierare, men vad händer om man vill inkludera @@ -312,10 +318,10 @@ matcha en punkt (i domännamnet), som vi måste uttrycka som Nu har vi tillräckligt stor kunskap för att uttrycka ett reguljärt uttryck som matchar en generell e-post\-adress. Vi börjar med att -beskriva \verb!!. Användarnamnet kunde som sagt var -innehålla små och stora bokstäver (från A till Z), siffror, punkt, -understreck, procenttecken, plustecken och bindestreck. Vi uttrycker -detta som +beskriva segmentet \linebreak\verb!!. Användar\-namnet +kunde som sagt var innehålla små och stora bokstäver (från A till Z), +siffror, punkt, under\-streck, procent\-tecken, plus\-tecken och +binde\-streck. Vi uttrycker detta som \begin{verbatim} \b[A-Za-z0-9._%+-]+ @@ -535,7 +541,7 @@ inkapslas exakt av den HTML-taggen och eventuella attribut. % av resultatet, koppling till tidigare studier. Reguljära uttryck har visat sig vara ett mycket användbart verktyg vid hämtning och tolkning av data ur text, dock kan det bli väldigt -beräkningstungt om man använder sig av de mer komplicerade former av +beräknings\-tungt om man använder sig av de mer komplicerade former av Reguljära uttryck där man sparar undan grupper av träffar i minnet. Den simplaste formen av Reguljära uttryck har en komplexitet på $O(n)$ där $n$ är antalet tecken i texten där ett mönster söks. -- 2.11.4.GIT