|
|
Borland Delphi >Статьи
Функции для парсинга строк
Здесь представлен модуль, в котором я
разместил много методов для обработки строк.
Некоторые функции поименованы по-шведски,
но, может-быть, Вы сможете понять, что они делают.
Вам потребуется один из методов,
называющийся stringreplaceall, который принимает при параметра -
исходную строку, подстроку для поиска и подстроку для замены, и
возвращает измененную строку. Будьте осторожны, если Вы меняется одну
подстроку на другую, чьей частью является первая. Вы должны делать это в
два прохода, или Вы попадете в бесконечный цикл.
Так, если Вы имеете текст, содержащий слово
Joe, и Вы хотите все его вхождения изменить на Joey, то Вы должны
сделать сперва нечто похожее на:
text := stringreplaceall (text,'Joe','Joeey');
И потом
text := stringreplaceall (text,'Joeey','Joey');
===
unit sparfunc;
interface
uses sysutils,classes;
function antaltecken (orgtext,soktext : string) : integer;
function beginsWith (text,teststreng : string):boolean;
function endsWith (text,teststreng : string):boolean;
function hamtastreng (text,strt,slut : string):string;
function hamtastrengmellan (text,strt,slut : string):string;
function nastadelare (progtext : string):integer;
function rtf2sgml (text : string) : string;
Function sgml2win(text : String) : String;
Function sgml2mac(text : String) : String;
Function sgml2rtf(text : string) : String;
function sistamening(text : string) : string;
function stringnthfield (text,delim : string; vilken : integer) : string;
function stringreplace (text,byt,mot : string) : string;
function stringreplaceall (text,byt,mot : string) : string;
function text2sgml (text : string) : string;
procedure SurePath (pathen : string);
procedure KopieraFil (infil,utfil : string);
function LasInEnTextfil (filnamn : string) : string;
implementation
function LasInEnTextfil (filnamn : string) : string;
var
infil : textfile;
temptext, filtext : string;
begin
filtext := '';
//Oppna angiven fil och las in den
try
assignfile (infil,filnamn); //Koppla en textfilsvariabel till pathname
reset (infil); //Oppna filen
while not eof(infil) do begin //Sa lange vi inte natt slutet
readln (infil,temptext); //Las in en rad
filtext := filtext+temptext; //Lagg den till variabeln SGMLTEXT
end; // while
finally //slutligen
closefile (infil); //Stang filen
end; //try
result := filtext;
end;
procedure KopieraFil (infil,utfil : string);
var
InStream : TFileStream;
OutStream : TFileStream;
begin
InStream := TFileStream.Create(infil,fmOpenRead);
try
OutStream := TFileStream.Create(utfil,fmOpenWrite or fmCreate);
try
OutStream.CopyFrom(InStream,0);
finally
OutStream.Free;
end;
finally
InStream.Free;
end;
end;
procedure SurePath (pathen : string);
var
temprad,del1 : string;
antal : integer;
begin
antal := antaltecken (pathen,'\');
if antal<3 then
createdir(pathen)
else begin
if pathen[length(pathen)] <> '\' then pathen := pathen+'\';
pathen := stringreplace(pathen,'\','/');
del1 := copy(pathen,1,pos('\',pathen));
pathen := stringreplace(pathen,del1,'');
del1 := stringreplace(del1,'/','\');
createdir (del1);
while pathen <> '' do begin
temprad := copy(pathen,1,pos('\',pathen));
pathen := stringreplace(pathen,temprad,'');
del1 := del1+ temprad;
temprad := '';
createdir(del1);
end;
end;
end;
function antaltecken (orgtext,soktext : string) : integer;
var
i,traffar,soklengd : integer;
begin
traffar := 0;
soklengd := length(soktext);
for i := 1 to length(orgtext) do
begin
if soktext = copy(orgtext,i,soklengd) then
traffar := traffar +1;
end;
result := traffar;
end;
function nastadelare (progtext : string):integer;
var
i,j : integer;
begin
i := pos('.',progtext);
j := pos('!',progtext);
if (j<i) and (j>0) then i := j;
j := pos('!',progtext);
if (j<i) and (j>0) then i := j;
j := pos('?',progtext);
if (j<i) and (j>0) then i := j;
result := i;
end;
function stringnthfield (text,delim : string; vilken : integer) : string;
var
start,slut,i : integer;
temptext : string;
begin
start := 0;
if vilken >0 then
begin
temptext := text;
if vilken = 1 then
begin
start := 1;
slut := pos (delim,text);
end
else
begin
for i:= 1 to vilken -1 do
begin
start := pos(delim,temptext)+length(delim);
temptext := copy(temptext,start,length(temptext));
end;
slut := pos (delim,temptext);
end;
if start >0 then
begin
if slut = 0 then slut := length(text);
result := copy (temptext,1,slut-1);
end
else
result := text;
end
else
result := text;
end;
function StringReplaceAll (text,byt,mot : string ) :string;
{Funktion for att byta ut alla forekomster av en strang mot en
annan strang in en strang. Den konverterade strangen returneras.
Om byt finns i mot maste vi ga via en temporar variant!!!}
var
plats : integer;
begin
While pos(byt,text) > 0 do
begin
plats := pos(byt,text);
delete (text,plats,length(byt));
insert (mot,text,plats);
end;
result := text;
end;
function StringReplace (text,byt,mot : string ) :string;
{Funktion for att byta ut den forsta forekomsten av en strang mot en
annan strang in en strang. Den konverterade strangen returneras.}
var
plats : integer;
begin
if pos(byt,text) > 0 then
begin
plats := pos(byt,text);
delete (text,plats,length(byt));
insert (mot,text,plats);
end;
result := text;
end;
function hamtastreng (text,strt,slut : string):string;
{Funktion for att hamta ut en delstrang ur en annan strang.
Om start och slut finns i text sa returneras en strang dar start
ingar i borjan och fram till tecknet fore slut.}
var
stplats,slutplats : integer;
resultat : string;
begin
resultat :='';
stplats := pos(strt,text);
if stplats >0 then
begin
text := copy (text,stplats,length(text));
slutplats := pos(slut,text);
if slutplats >0 then
begin
resultat := copy(text,1,slutplats-1);
end;
end;
result := resultat;
end;
function hamtastrengmellan (text,strt,slut : string):string;
{Funktion for att hamta ut en delstrang ur en annan strang.
Om start och slut finns i text sa returneras en strang dar start
ingar i borjan och fram till tecknet fore slut.}
var
stplats,slutplats : integer;
resultat : string;
begin
resultat :='';
stplats := pos(strt,text);
if stplats >0 then
begin
text := copy (text,stplats+length(strt),length(text));
slutplats := pos(slut,text);
if slutplats >0 then
begin
resultat := copy(text,1,slutplats-1);
end;
end;
result := resultat;
end;
function endsWith (text,teststreng : string):boolean;
{Kollar om en strang slutar med en annan strang.
Returnerar true eller false.}
var
textlngd,testlngd : integer;
kollstreng : string;
begin
testlngd := length(teststreng);
textlngd := length (text);
if textlngd > testlngd then
begin
kollstreng := copy (text,(textlngd+1)-testlngd,testlngd);
if kollstreng = teststreng then
result := true
else
result := false;
end
else
result := false;
end;
function beginsWith (text,teststreng : string):boolean;
{Funktion for att kolla om text borjar med teststreng.
Returnerar true eller false.}
var
textlngd,testlngd : integer;
kollstreng : string;
begin
testlngd := length(teststreng);
textlngd := length (text);
if textlngd >= testlngd then
begin
kollstreng := copy (text,1,testlngd);
if kollstreng = teststreng then
result := true
else
result := false;
end
else
result := false;
end;
function sistamening(text : string) : string;
//Funktion for att ta fram sista meningen i en strang. Soker pa !?.
var
i:integer;
begin
i :=length(text)-1;
while (copy(text,i,1)<> '.') and (copy(text,i,1)<> '!') and
(copy(text,i,1)<> '?') do
begin
dec(i);
if i =1 then break
end;
if i>1 then
result := copy(text,i,length(text))
else
result := '';
end;
Function text2sgml(text : String) : String;
{Funktion som byter ut alla ovanliga tecken mot entiteter.
Den fardiga texten returneras.}
begin
text := stringreplaceall (text,'&','##amp;');
text := stringreplaceall (text,'##amp','&');
text := stringreplaceall (text,'a','å');
text := stringreplaceall (text,'A','Å');
text := stringreplaceall (text,'a','ä');
text := stringreplaceall (text,'A','Ä');
text := stringreplaceall (text,'a','á');
text := stringreplaceall (text,'A','Á');
text := stringreplaceall (text,'a','à');
text := stringreplaceall (text,'A','À');
text := stringreplaceall (text,'?','æ');
text := stringreplaceall (text,'?','&Aelig;');
text := stringreplaceall (text,'A','Â');
text := stringreplaceall (text,'a','â');
text := stringreplaceall (text,'a','ã');
text := stringreplaceall (text,'A','Ã');
text := stringreplaceall (text,'c','ç');
text := stringreplaceall (text,'C','Ç');
text := stringreplaceall (text,'e','é');
text := stringreplaceall (text,'E','É');
text := stringreplaceall (text,'e','ê');
text := stringreplaceall (text,'E','Ê');
text := stringreplaceall (text,'e','ë');
text := stringreplaceall (text,'E','Ë');
text := stringreplaceall (text,'e','è');
text := stringreplaceall (text,'E','È');
text := stringreplaceall (text,'i','î');
text := stringreplaceall (text,'I','Î');
text := stringreplaceall (text,'i','í');
text := stringreplaceall (text,'I','Í');
text := stringreplaceall (text,'i','ì');
text := stringreplaceall (text,'I','Ì');
text := stringreplaceall (text,'i','ï');
text := stringreplaceall (text,'I','Ï');
text := stringreplaceall (text,'n','ñ');
text := stringreplaceall (text,'N','Ñ');
text := stringreplaceall (text,'o','ö');
text := stringreplaceall (text,'O','Ö');
text := stringreplaceall (text,'o','ò');
text := stringreplaceall (text,'O','Ò');
text := stringreplaceall (text,'o','ó');
text := stringreplaceall (text,'O','Ó');
text := stringreplaceall (text,'o','ø');
text := stringreplaceall (text,'O','Ø');
text := stringreplaceall (text,'O','Ô');
text := stringreplaceall (text,'o','ô');
text := stringreplaceall (text,'o','õ');
text := stringreplaceall (text,'O','Õ');
text := stringreplaceall (text,'u','ü');
text := stringreplaceall (text,'U','Ü');
text := stringreplaceall (text,'u','ú');
text := stringreplaceall (text,'U','Ú');
text := stringreplaceall (text,'U','Ù');
text := stringreplaceall (text,'u','ù');
text := stringreplaceall (text,'u','û');
text := stringreplaceall (text,'U','Û');
text := stringreplaceall (text,'y','ý');
text := stringreplaceall (text,'Y','Ý');
text := stringreplaceall (text,'y','ÿ');
text := stringreplaceall (text,'|',' ');
result := text;
End;
Function sgml2win(text : String) : String;
{Funktion som ersatter alla entiteter mot deras tecken i
windows. Den fardiga strangen returneras.}
begin
text := stringreplaceall (text,'á','a');
text := stringreplaceall (text,'Á','A');
text := stringreplaceall (text,'æ','?');
text := stringreplaceall (text,'&Aelig;','?');
text := stringreplaceall (text,'à','a');
text := stringreplaceall (text,'À','A');
text := stringreplaceall (text,'å','a');
text := stringreplaceall (text,'Å','A');
text := stringreplaceall (text,'ä','a');
text := stringreplaceall (text,'Ä','A');
text := stringreplaceall (text,'Â' ,'A');
text := stringreplaceall (text,'â' ,'a');
text := stringreplaceall (text,'ã','a');
text := stringreplaceall (text,'Ã','A');
text := stringreplaceall (text,'ç','c');
text := stringreplaceall (text,'Ç','C');
text := stringreplaceall (text,'é','e');
text := stringreplaceall (text,'É','E');
text := stringreplaceall (text,'è','e');
text := stringreplaceall (text,'È','E');
text := stringreplaceall (text,'ê' ,'e');
text := stringreplaceall (text,'Ê' ,'E');
text := stringreplaceall (text,'ë' ,'e');
text := stringreplaceall (text,'Ë' ,'E');
text := stringreplaceall (text,'î' ,'i');
text := stringreplaceall (text,'Î' ,'I');
text := stringreplaceall (text,'í','i');
text := stringreplaceall (text,'Í','I');
text := stringreplaceall (text,'ì','i');
text := stringreplaceall (text,'Ì','I');
text := stringreplaceall (text,'ï' ,'i');
text := stringreplaceall (text,'Ï' ,'I');
text := stringreplaceall (text,'ñ','n');
text := stringreplaceall (text,'Ñ','N');
text := stringreplaceall (text,'ò','o');
text := stringreplaceall (text,'Ò','O');
text := stringreplaceall (text,'ó','o');
text := stringreplaceall (text,'Ó','O');
text := stringreplaceall (text,'ö','o');
text := stringreplaceall (text,'Ö','O');
text := stringreplaceall (text,'ø','o');
text := stringreplaceall (text,'Ø','O');
text := stringreplaceall (text,'Ô' ,'O');
text := stringreplaceall (text,'ô' ,'o');
text := stringreplaceall (text,'õ','o');
text := stringreplaceall (text,'Õ','O');
text := stringreplaceall (text,'ü','u');
text := stringreplaceall (text,'Ü','U');
text := stringreplaceall (text,'ú','u');
text := stringreplaceall (text,'Ú','U');
text := stringreplaceall (text,'û' ,'u');
text := stringreplaceall (text,'Û' ,'U');
text := stringreplaceall (text,'Ù','U');
text := stringreplaceall (text,'ù','u');
text := stringreplaceall (text,'ý','y');
text := stringreplaceall (text,'Ý','Y');
text := stringreplaceall (text,'ÿ' ,'y');
text := stringreplaceall (text,' ','|');
text := stringreplaceall (text,'&','&');
result := text;
End;
Function sgml2mac(text : String) : String;
{Funktion som ersatter alla entiteter mot deras tecken i
mac. Den fardiga strangen returneras.}
begin
text := stringreplaceall (text,'á',chr(135));
text := stringreplaceall (text,'Á',chr(231));
text := stringreplaceall (text,'æ',chr(190));
text := stringreplaceall (text,'&Aelig;',chr(174));
text := stringreplaceall (text,'à',chr(136));
text := stringreplaceall (text,'À',chr(203));
text := stringreplaceall (text,'å',chr(140));
text := stringreplaceall (text,'Å',chr(129));
text := stringreplaceall (text,'Ä',chr(128));
text := stringreplaceall (text,'ä',chr(138));
text := stringreplaceall (text,'Â' ,chr(229));
text := stringreplaceall (text,'â' ,chr(137));
text := stringreplaceall (text,'ã',chr(139));
text := stringreplaceall (text,'Ã',chr(204));
text := stringreplaceall (text,'ç',chr(141));
text := stringreplaceall (text,'Ç',chr(130));
text := stringreplaceall (text,'é',chr(142));
text := stringreplaceall (text,'É',chr(131));
text := stringreplaceall (text,'è',chr(143));
text := stringreplaceall (text,'È',chr(233));
text := stringreplaceall (text,'ê' ,chr(144));
text := stringreplaceall (text,'Ê' ,chr(230));
text := stringreplaceall (text,'ë' ,chr(145));
text := stringreplaceall (text,'Ë' ,chr(232));
text := stringreplaceall (text,'î' ,chr(148));
text := stringreplaceall (text,'Î' ,chr(235));
text := stringreplaceall (text,'í' ,chr(146));
text := stringreplaceall (text,'Í' ,chr(234));
text := stringreplaceall (text,'ì' ,chr(147));
text := stringreplaceall (text,'Ì' ,chr(237));
text := stringreplaceall (text,'ï' ,chr(149));
text := stringreplaceall (text,'Ï' ,chr(236));
text := stringreplaceall (text,'ñ',chr(150));
text := stringreplaceall (text,'Ñ',chr(132));
text := stringreplaceall (text,'ò',chr(152));
text := stringreplaceall (text,'Ò',chr(241));
text := stringreplaceall (text,'ó',chr(151));
text := stringreplaceall (text,'Ó',chr(238));
text := stringreplaceall (text,'Ô' ,chr(239));
text := stringreplaceall (text,'ô' ,chr(153));
text := stringreplaceall (text,'ø',chr(191));
text := stringreplaceall (text,'Ø',chr(175));
text := stringreplaceall (text,'õ',chr(155));
text := stringreplaceall (text,'Õ',chr(239));
text := stringreplaceall (text,'ö',chr(154));
text := stringreplaceall (text,'Ö',chr(133));
text := stringreplaceall (text,'ü',chr(159));
text := stringreplaceall (text,'Ü',chr(134));
text := stringreplaceall (text,'ú',chr(156));
text := stringreplaceall (text,'Ú',chr(242));
text := stringreplaceall (text,'û' ,chr(158));
text := stringreplaceall (text,'Û' ,chr(243));
text := stringreplaceall (text,'Ù',chr(244));
text := stringreplaceall (text,'ù',chr(157));
text := stringreplaceall (text,'ý','y');
text := stringreplaceall (text,'ÿ' ,chr(216));
text := stringreplaceall (text,'Ÿ' ,chr(217));
text := stringreplaceall (text,' ',' ');
text := stringreplaceall (text,'&',chr(38));
result := text;
End;
Function sgml2rtf(text : string) : String;
{Funktion for att byta ut sgml-entiteter mot de koder som
galler i RTF-textrutorna.}
begin
text := stringreplaceall (text,'}','#]#');
text := stringreplaceall (text,'{','#[#');
text := stringreplaceall (text,'\','HSALSKCAB');
text := stringreplaceall (text,'HSALSKCAB','\\');
text := stringreplaceall (text,'æ','\'+chr(39)+'c6');
text := stringreplaceall (text,'&Aelig;','\'+chr(39)+'e6');
text := stringreplaceall (text,'á','\'+chr(39)+'e1');
text := stringreplaceall (text,'Á','\'+chr(39)+'c1');
text := stringreplaceall (text,'à','\'+chr(39)+'e0');
text := stringreplaceall (text,'À','\'+chr(39)+'c0');
text := stringreplaceall (text,'å','\'+chr(39)+'e5');
text := stringreplaceall (text,'Å','\'+chr(39)+'c5');
text := stringreplaceall (text,'Â','\'+chr(39)+'c2');
text := stringreplaceall (text,'â','\'+chr(39)+'e2');
text := stringreplaceall (text,'ã','\'+chr(39)+'e3');
text := stringreplaceall (text,'Ã','\'+chr(39)+'c3');
text := stringreplaceall (text,'ä','\'+chr(39)+'e4');
text := stringreplaceall (text,'Ä','\'+chr(39)+'c4');
text := stringreplaceall (text,'ç','\'+chr(39)+'e7');
text := stringreplaceall (text,'Ç','\'+chr(39)+'c7');
text := stringreplaceall (text,'é','\'+chr(39)+'e9');
text := stringreplaceall (text,'É','\'+chr(39)+'c9');
text := stringreplaceall (text,'è','\'+chr(39)+'e8');
text := stringreplaceall (text,'È','\'+chr(39)+'c8');
text := stringreplaceall (text,'ê','\'+chr(39)+'ea');
text := stringreplaceall (text,'Ê','\'+chr(39)+'ca');
text := stringreplaceall (text,'ë','\'+chr(39)+'eb');
text := stringreplaceall (text,'Ë','\'+chr(39)+'cb');
text := stringreplaceall (text,'î','\'+chr(39)+'ee');
text := stringreplaceall (text,'Î','\'+chr(39)+'ce');
text := stringreplaceall (text,'í','\'+chr(39)+'ed');
text := stringreplaceall (text,'Í','\'+chr(39)+'cd');
text := stringreplaceall (text,'ì','\'+chr(39)+'ec');
text := stringreplaceall (text,'Ì','\'+chr(39)+'cc');
text := stringreplaceall (text,'ï' ,'\'+chr(39)+'ef');
text := stringreplaceall (text,'Ï' ,'\'+chr(39)+'cf');
text := stringreplaceall (text,'ñ','\'+chr(39)+'f1');
text := stringreplaceall (text,'Ñ','\'+chr(39)+'d1');
text := stringreplaceall (text,'ö','\'+chr(39)+'f6');
text := stringreplaceall (text,'Ö','\'+chr(39)+'d6');
text := stringreplaceall (text,'ó','\'+chr(39)+'f3');
text := stringreplaceall (text,'Ó','\'+chr(39)+'d3');
text := stringreplaceall (text,'ò','\'+chr(39)+'f2');
text := stringreplaceall (text,'Ò','\'+chr(39)+'d2');
text := stringreplaceall (text,'ø','\'+chr(39)+'f8');
text := stringreplaceall (text,'Ø','\'+chr(39)+'d8');
text := stringreplaceall (text,'Ô','\'+chr(39)+'d4');
text := stringreplaceall (text,'ô','\'+chr(39)+'f4');
text := stringreplaceall (text,'õ','\'+chr(39)+'f5');
text := stringreplaceall (text,'Õ','\'+chr(39)+'d5');
text := stringreplaceall (text,'ú','\'+chr(39)+'fa');
text := stringreplaceall (text,'Ú','\'+chr(39)+'da');
text := stringreplaceall (text,'û','\'+chr(39)+'fb');
text := stringreplaceall (text,'Û','\'+chr(39)+'db');
text := stringreplaceall (text,'Ù','\'+chr(39)+'d9');
text := stringreplaceall (text,'ù','\'+chr(39)+'f9');
text := stringreplaceall (text,'ü','\'+chr(39)+'fc');
text := stringreplaceall (text,'Ü','\'+chr(39)+'dc');
text := stringreplaceall (text,'ý','\'+chr(39)+'fd');
text := stringreplaceall (text,'Ý','\'+chr(39)+'dd');
text := stringreplaceall (text,'ÿ','\'+chr(39)+'ff');
text := stringreplaceall (text,'£','\'+chr(39)+'a3');
text := stringreplaceall (text,'#]#','\}');
text := stringreplaceall (text,'#[#','\{');
text := stringreplaceall (text,' ','|');
text := stringreplaceall (text,'&','&');
result := text;
End;
function rtf2sgml (text : string) : string;
{Funktion for att konvertera en RTF-rad till SGML-text.}
var
temptext : string;
start : integer;
begin
text := stringreplaceall (text,'&','##amp;');
text := stringreplaceall (text,'##amp','&');
text := stringreplaceall (text,'\'+chr(39)+'c6','æ');
text := stringreplaceall (text,'\'+chr(39)+'e6','&Aelig;');
text := stringreplaceall (text,'\'+chr(39)+'e5','å');
text := stringreplaceall (text,'\'+chr(39)+'c5','Å');
text := stringreplaceall (text,'\'+chr(39)+'e4','ä');
text := stringreplaceall (text,'\'+chr(39)+'c4','Ä');
text := stringreplaceall (text,'\'+chr(39)+'e1','á');
text := stringreplaceall (text,'\'+chr(39)+'c1','Á');
text := stringreplaceall (text,'\'+chr(39)+'e0','à');
text := stringreplaceall (text,'\'+chr(39)+'c0','À');
text := stringreplaceall (text,'\'+chr(39)+'c2','Â');
text := stringreplaceall (text,'\'+chr(39)+'e2','â');
text := stringreplaceall (text,'\'+chr(39)+'e3','ã');
text := stringreplaceall (text,'\'+chr(39)+'c3','Ã');
text := stringreplaceall (text,'\'+chr(39)+'e7','ç');
text := stringreplaceall (text,'\'+chr(39)+'c7','Ç');
text := stringreplaceall (text,'\'+chr(39)+'e9','é');
text := stringreplaceall (text,'\'+chr(39)+'c9','É');
text := stringreplaceall (text,'\'+chr(39)+'e8','è');
text := stringreplaceall (text,'\'+chr(39)+'c8','È');
text := stringreplaceall (text,'\'+chr(39)+'ea','ê');
text := stringreplaceall (text,'\'+chr(39)+'ca','Ê');
text := stringreplaceall (text,'\'+chr(39)+'eb','ë');
text := stringreplaceall (text,'\'+chr(39)+'cb','Ë');
text := stringreplaceall (text,'\'+chr(39)+'ee','î');
text := stringreplaceall (text,'\'+chr(39)+'ce','Î');
text := stringreplaceall (text,'\'+chr(39)+'ed','í');
text := stringreplaceall (text,'\'+chr(39)+'cd','Í');
text := stringreplaceall (text,'\'+chr(39)+'ec','ì');
text := stringreplaceall (text,'\'+chr(39)+'cc','Ì');
text := stringreplaceall (text,'\'+chr(39)+'ef','ï');
text := stringreplaceall (text,'\'+chr(39)+'cf','Ï');
text := stringreplaceall (text,'\'+chr(39)+'f1','ñ');
text := stringreplaceall (text,'\'+chr(39)+'d1','Ñ');
text := stringreplaceall (text,'\'+chr(39)+'f3','ó');
text := stringreplaceall (text,'\'+chr(39)+'d3','Ó');
text := stringreplaceall (text,'\'+chr(39)+'f2','ò');
text := stringreplaceall (text,'\'+chr(39)+'d2','Ò');
text := stringreplaceall (text,'\'+chr(39)+'d4','Ô');
text := stringreplaceall (text,'\'+chr(39)+'f4','ô');
text := stringreplaceall (text,'\'+chr(39)+'f5','õ');
text := stringreplaceall (text,'\'+chr(39)+'d5','Õ');
text := stringreplaceall (text,'\'+chr(39)+'f8','ø');
text := stringreplaceall (text,'\'+chr(39)+'d8','Ø');
text := stringreplaceall (text,'\'+chr(39)+'f6','ö');
text := stringreplaceall (text,'\'+chr(39)+'d6','Ö');
text := stringreplaceall (text,'\'+chr(39)+'fc','ü');
text := stringreplaceall (text,'\'+chr(39)+'dc','Ü');
text := stringreplaceall (text,'\'+chr(39)+'fa','ú');
text := stringreplaceall (text,'\'+chr(39)+'da','Ú');
text := stringreplaceall (text,'\'+chr(39)+'fb','û');
text := stringreplaceall (text,'\'+chr(39)+'db','Û');
text := stringreplaceall (text,'\'+chr(39)+'d9','Ù');
text := stringreplaceall (text,'\'+chr(39)+'f9','ù');
text := stringreplaceall (text,'\'+chr(39)+'fd','ý');
text := stringreplaceall (text,'\'+chr(39)+'dd','Ý');
text := stringreplaceall (text,'\'+chr(39)+'ff','ÿ');
text := stringreplaceall (text,'|',' ');
text := stringreplaceall (text,'\'+chr(39)+'a3','£');
text := stringreplaceall (text,'\}','#]#');
text := stringreplaceall (text,'\{','#[#');
if (beginswith (text, '{\rtf1\')) or (beginswith (text, '{\colortbl\')) then
begin
result := '';
exit;
end;
//text := stringreplaceall (text,'{\fonttbl',''); {Skall alltid tas bort}
//temptext := hamtastreng (text,'{\rtf1','{\f0');{Skall alltid tas bort}
//text := stringreplace (text,temptext,'');
//temptext := hamtastreng (text,'{\f0','{\f1');{Skall alltid tas bort}
//text := stringreplace (text,temptext,'');
//temptext := hamtastreng (text,'{\f1','{\f2');{Skall alltid tas bort}
//text := stringreplace (text,temptext,'');
//text := stringreplaceall (text,'{\f2\fswiss\fprq2 System;}}','');
{Skall alltid tas bort}
//text := stringreplaceall (text,'{\colortbl\red0\green0\blue0;}','');
{Skall alltid tas bort}
{I version 2.01 av Delphi finns inte \cf0 med i RTF-rutan.
Tog darfor bort
det efter \fs16 och la istallet en egen tvatt av \cf0.}
//temptext := hamtastreng (text,'{\rtf1','\deflang');
//text := stringreplace (text,temptext,'');
{Hamta och radera allt fran start till deflang}
text := stringreplaceall (text,'\cf0','');
temptext := hamtastreng (text,'\deflang','\pard');
{Plocka fran deflang till pard for att fa }
text := stringreplace (text,temptext,'');{oavsett vilken lang det ar.
Norska o svenska ar olika}
text := stringreplaceall (text,'\ltrpar','');
text := stringreplaceall (text,'\ql','');
text := stringreplaceall (text,'\ltrch','');
{Har skall vi plocka bort fs och flera olika siffror
beroende pa vilka alternativ vi godkanner.}
//text := stringreplaceall (text,'\fs16','');{8 punkter}
//text := stringreplaceall (text,'\fs20','');{10 punkter}
{Nu stadar vi istallet bort alla tvasiffriga fontsize.}
while pos ('\fs',text) >0 do
begin
//application.processmessages;
start := pos ('\fs',text);
Delete(text,start,5);
end;
while pos ('\f',text) >0 do
begin
//application.processmessages;
start := pos ('\f',text);
Delete(text,start,3);
end;
text := stringreplaceall (text,
'\pard\li200-200{\*\pn\pnlvlblt\pnf1\pnindent200{\pntxtb\'+
chr(39)+'b7}}\plain ','</P><UL>');
text := stringreplaceall (text,'{\pntext\'+chr(39)+'b7\tab}','<LI>');
text := stringreplaceall (text, '\par <LI>','<LI>');
text := stringreplaceall (text, '\par <UL>','<UL>');
text := stringreplaceall (text,'\pard\plain ','<P>');
text := stringreplaceall (text,'\par \plain\b\ul ','</P><MELLIS>');
text := stringreplaceall (text,'\plain\b\ul ','</P><MELLIS>');
text := stringreplaceall (text,'\plain','</MELLIS>');
text := stringreplaceall (text,'\par }','</P>');
if (pos ('\par \tab ',text)>0) or (pos ('<P>\tab ',text)>0) then
begin
text := stringreplaceall (text,'\par \tab ','<TR><TD>');
text := stringreplaceall (text,'<P>\tab ','<TR><TD>');
text := stringreplaceall (text,'\tab ','</TD><TD>');
end
else
begin
text := stringreplaceall (text,'\tab ','');
end;
text := stringreplaceall (text,'\par ','</P><P>');
text := stringreplaceall (text,'#]#','}');
text := stringreplaceall (text,'#[#','{');
text := stringreplaceall (text,'\\','\');
if pos('<TD>',text)>0 then text := text+'</TD></TR>';
if pos('<LI>',text)>0 then text := text+'</LI>';
result := text;
end;
end.
И еще: Как перевести RTF в HTML?
Здесь процедура, которую я использую для конвертации содержимого
RichEdit в код SGML. Она не создает полноценный HTML-файл, но Вы можете
расширить функциональность, указал, какие RTF-коды Вы желаете
конвертировать в какие-либо HTML-тэги.
function rtf2sgml (text : string) : string;
{Funktion for att konvertera en RTF-rad till SGML-text.}
var
temptext : string;
start : integer;
begin
text := stringreplaceall (text,'&','##amp;');
text := stringreplaceall (text,'##amp','&');
text := stringreplaceall (text,'\'+chr(39)+'e5','å');
text := stringreplaceall (text,'\'+chr(39)+'c5','Å');
text := stringreplaceall (text,'\'+chr(39)+'e4','ä');
text := stringreplaceall (text,'\'+chr(39)+'c4','Ä');
text := stringreplaceall (text,'\'+chr(39)+'f6','ö');
text := stringreplaceall (text,'\'+chr(39)+'d6','Ö');
text := stringreplaceall (text,'\'+chr(39)+'e9','é');
text := stringreplaceall (text,'\'+chr(39)+'c9','É');
text := stringreplaceall (text,'\'+chr(39)+'e1','á');
text := stringreplaceall (text,'\'+chr(39)+'c1','Á');
text := stringreplaceall (text,'\'+chr(39)+'e0','à');
text := stringreplaceall (text,'\'+chr(39)+'c0','À');
text := stringreplaceall (text,'\'+chr(39)+'f2','ò');
text := stringreplaceall (text,'\'+chr(39)+'d2','Ò');
text := stringreplaceall (text,'\'+chr(39)+'fc','ü');
text := stringreplaceall (text,'\'+chr(39)+'dc','Ü');
text := stringreplaceall (text,'\'+chr(39)+'a3','£');
text := stringreplaceall (text,'\}','#]#');
text := stringreplaceall (text,'\{','#[#');
text := stringreplaceall (text,'{\rtf1\ansi\deff0\deftab720','');
{Skall alltid tas bort}
text := stringreplaceall (text,'{\fonttbl',''); {Skall alltid tas bort}
text := stringreplaceall (text,'{\f0\fnil MS Sans Serif;}','');
{Skall alltid tas bort}
text := stringreplaceall (text,'{\f1\fnil\fcharset2 Symbol;}','');
{Skall alltid tas bort}
text := stringreplaceall (text,'{\f2\fswiss\fprq2 System;}}','');
{Skall alltid tas bort}
text := stringreplaceall (text,'{\colortbl\red0\green0\blue0;}','');
{Skall alltid tas bort}
{I version 2.01 av Delphi finns inte \cf0 med i RTF-rutan. Tog
darfor bort det efter \fs16 och la istallet en egen tvatt av \cf0.}
//temptext := hamtastreng (text,'{\rtf1','\deflang');
//text := stringreplace (text,temptext,''); {Hamta och
radera allt fran start till deflang}
text := stringreplaceall (text,'\cf0','');
temptext := hamtastreng (text,'\deflang','\pard');
{Plocka fran deflang till pard for att fa }
text := stringreplace (text,temptext,'');
{oavsett vilken lang det ar. Norska o svenska ar olika}
{Har skall vi plocka bort fs och flera olika siffror
beroende pa vilka alternativ vi godkanner.}
//text := stringreplaceall (text,'\fs16','');{8 punkter}
//text := stringreplaceall (text,'\fs20','');{10 punkter}
{Nu stadar vi istallet bort alla tvasiffriga fontsize.}
while pos ('\fs',text) >0 do
begin
application.processmessages;
start := pos ('\fs',text);
Delete(text,start,5);
end;
text := stringreplaceall (text,'\pard\plain\f0 ','<P>');
text := stringreplaceall (text,'\par \plain\f0\b\ul ',
'</P><MELLIS>');
text := stringreplaceall (text,'\plain\f0\b\ul ',
'</P><MELLIS>');
text := stringreplaceall (text,'\plain\f0','</MELLIS>');
text := stringreplaceall (text,'\par }','</P>');
text := stringreplaceall (text,'\par ','</P><P>');
text := stringreplaceall (text,'#]#','}');
text := stringreplaceall (text,'#[#','{');
text := stringreplaceall (text,'\\','\');
result := text;
end;
// This is cut directly from the middle of a fairly
// long save routine that calls the
// above function. I know I could use streams
// instead of going through a separate
// file but I have not had the time to change this
utfilnamn := mditted.exepath+stringreplace(stringreplace(
extractfilename(pathname),'.TTT',''),'.ttt','') + 'ut.RTF';
brodtext.lines.savetofile (utfilnamn);
temptext := '';
assignfile(tempF,utfilnamn);
reset (tempF);
try
while not eof(tempF) do
begin
readln (tempF,temptext2);
temptext2 := stringreplaceall (temptext2,'\'+
chr(39)+'b6','');
temptext2 := rtf2sgml (temptext2);
if temptext2 <>'' then temptext := temptext+
temptext2;
application.processmessages;
end;
finally
closefile (tempF);
end;
deletefile (utfilnamn);
temptext := stringreplaceall (temptext,'</MELLIS> ',
'</MELLIS>');
temptext := stringreplaceall (temptext,'</P> ',
'</P>');
temptext := stringreplaceall (temptext,'</P>'+chr(0),
'</P>');
temptext := stringreplaceall (temptext,'</MELLIS>
</P>','</MELLIS>');
temptext := stringreplaceall (temptext,'<P><
/P>','');
temptext := stringreplaceall (temptext,
'</P><P></MELLIS>','</MELLIS>
<P>');
temptext := stringreplaceall (temptext,'</MELLIS>',
'<#MELLIS><P>');
temptext := stringreplaceall (temptext,'<#MELLIS>',
'</MELLIS>');
temptext := stringreplaceall (temptext,'<P><
P>','<P>');
temptext := stringreplaceall (temptext,'<P> ','<
P>');
temptext := stringreplaceall (temptext,'<P>-','<
P>_');
temptext := stringreplaceall (temptext,'<P>_','<
CITAT>_');
while pos('<CITAT>_',temptext)>0 do
begin
application.processmessages;
temptext2 := hamtastreng (temptext,'<CITAT>_','</P>');
temptext := stringreplace (temptext,temptext2+'</P>
',temptext2+'</CITAT>');
temptext := stringreplace (temptext,'<CITAT>_',
'<CITAT>-');
end;
writeln (F,'<BRODTEXT>'+temptext+'</BRODTEXT>');
|