Spis treści

Status programu "PoliczLinie"
Do czego służy program PoliczLinie
|
Co nowego w wersji 1.5? |
Typowe zastosowania |
Możliwości rozbudowy programu - oferta |
Jeszcze o programie PoliczLinie

Status programu PoliczLinie

Program ma status Freeware - tzn. może być bez żadnych ograniczeń używany, kopiowany i dystrybuowany w dowolny sposób. Może być stosowany do użytku osobistego i firmowego. Jedynym ograniczeniem dystrybucyjnym jest konieczność każdorazowego dodawania do pliku programu NINIEJSZEJ INSTRUKCJI W NIEZMIENIONEJ FORMIE.

Program PoliczLinie - do czego służy

Program PoliczLinie służy do obróbki plików tekstowych - logów, danych w formacie tekstowym, lub rozdzielanym separatorami - jak csv. Wykonuje on dwie podstawowe czynności:

liczy ile linii (akapitów) w danym pliku tekstowym zawiera określoną frazę
ew. kopiuje wszystkie te linie do nowego pliku umieszczonego w tym samym katalogu co plik źródłowy
Program Policz Linie w wersji 1,5 umożliwia także kopiowanie wszystkich linii NIE zawierających poszukiwanej frazy, dzięki czemu pozwala na szybkie dzielenie plików tekstowych na części.

Program jest szybki w działaniu i prosty w obsłudze.

 

Co nowego w wersji 1.5?

Wersja 1,5 programu Policz Linie zawiera kilka usprawnień:

poprawiono pewne drobne błędy
dodano możliwość wczytywanie pliku startowego w linii komend
dodano opcję kopiowania do pliku wszystkich linii NIE zawierających szukanej frazy.
dodano przycisk "O Policz linie"

Typowe zastosowania programu

Typowe zastosowania obejmują:

wyszukiwanie kodów błędów w raportach zawierających błędy
wyszukiwanie ścieżek do programów w logach serwera
proste filtrowanie dużych plików tekstowych
podział plików tekstowych na dwie rozdzielne części w zależności od obecności wyspecyfikowanej frazy.

Zastosowanie programu bardziej szczegółowo przedstawione zostanie na poniższych przykładach.

Przykład 1. - lista polskich szachistów

W swoim czasie ściągnąłem z Internetu plik zawierający rankingi wszystkich szachistów zarejestrowanych przez międzynarodową organizację szachową FIDE. Plik miał strukturę kolejnych linii o identycznej strukturze. 

Oto jego fragment - 2 linie pliku wybrane losowo ze środka:

1101439  Adamski, Andrzej                  m   POL  2313    0  13.01.39       
14106680 Abakarov, Alexander                   UKR  2320    0  28.07.72 i      

Każda linia zawiera numer gracza, imię i nazwisko, tytuł, oznaczenie kraju, ranking, ilość rozegranych partii, datę urodzenia.  

Chciałem mieć z tego listę tylko polskich szachistów. Problem w tym, że plik zawierał dane o prawie 50 tys. szachistów, czyli 50 tys. linii (prawie 4 MB danych!!!), a posegregowani byli oni według nazwisk (alfabetycznie), a nie według krajów. Zrobienie całej tej roboty ręcznie wydawało się koszmarem!

Tymczasem wyseparowanie szukanych linii zawierających oznaczenie kraju POL za pomocą programu PoliczLinie jest absolutnie banalne. Wczytanie pliku i wykonanie stosownej operacji trwało kilka sekund.

Przykład 2. - analiza logów serwera Apache

Moja strona internetowa http://www.daktik.rubikon.pl jest obsługiwana przez providera zapewniającego dostęp do logów systemowych. Można więc sobie ściągnąć dane o pobieraniu każdego pliku z mojej witryny. Każdy pobranie pliku jest zapisywane w oddzielnej linii. 

Zadanie miałem następujące - sprawdzić dla jakich plików występują błędy pobierania (najczęściej oznaczane numerem 404). 
Jak jednak wyseparować te linie spośród dostępnych ponad 100 tysięcy wpisów dla jednego dnia?
Ręcznie - jest bardzo dużo roboty (nawet z pomocą standardowej funkcji "Znajdź")
- odpowiedź jest prosta - wystarczyło wpisać frazę 404 do okienka wyszukiwania programu PoliczLinie, zaznaczyć "Linie kopiuj do pliku wynikowego" i po paru sekundach otrzymałem to co chciałem (z drobnym błędem, bo znalazły się też linie, gdzie szukana fraza była częścią większej liczby, ale takich przypadków nie było wiele).

Przykład 3 - przeszukiwanie baz tekstowych csv i tab delimited

Ten przykład nie wiązał się akurat z moją działalnością, ale myślę, że przyda się wielu osobom  Jest taki format danych, mający rozszerzenie "csv", który zawiera tabele danych. Poszczególne kolumny tabeli rozdzielane są znakami średnika. 

Podobnym formatem do scv jest "tab delimited" - format, w którym separatorem kolumn jest znak tabulatora (kod ASCII 9). Oba te formaty są obsługiwane np. przez program Microosft Excell. Po co więc dodatkowy program?

po pierwsze - bo jest on za darmo 
po drugie - nie ma ograniczenia ilości wierszy, które ma Excel (przynajmniej w wersjach do 9.0)
po trzecie jest o wiele szybszy w działaniu, jeśli tylko chcemy uzyskać prostą informację i ew. skopiować linie z określonymi danymi.
da się uruchomić na bardzo leciwym komputerze (warunek - zainstalowane Windows 95 lub wyżej)

W celu obsłużenia obu formatów przez program PoliczLinie, należy kliknąć opcję "Pokaż zaawansowane" i tam dodatkowo "Szukaj w określonej kolumnie". Jako separator należy ustawić średnik, tabulator (lub ew. inną wartość, którą można wpisać z klawiatury, lub wybrać z listy rozwijanej). Oczywiście wpisanie numeru kolumny jest niezbędne w celu dokończenia ustawień. 

 

O rozbudowie programu PoliczLinie

Program PoliczLinie w aktualnej wersji robi - to co widać. Zapewne w szczególnych zastosowaniach, jego możliwości są niewystarczające. Aby uzyskać wersję programu rozbudowaną o nowe opcje, należy napisać e-mail do autora programu (na adres: redakcja@fizykon.org), uzgodnić zakres zmian i zapłacić uzgodnioną kwotę przelewem na konto. Nowa wersja programu zostanie dosłana jak najszybciej (w prostszych przypadkach nawet tego samego dnia).

Koszt pierwszej nieskomplikowanej (małej) zmiany w programie to 100 zł (lub 30$, czy odpowiednia kwota w euro). Każda kolejna mała zmian jest płatna po 50 zł (lub 15$). Poważniejsze modyfikacje programu możliwe są po uzgodnieniu warunków finansowych.

Lista (przykładowa) możliwych małych zmian:

umieszczenie na formularzu loga firmy
zamiana ikony programu na firmową
dodanie menu (a w nim ew. nowych funkcji), paska narzędzi
obliczanie prostych statystyk
dołączenie dokładniejszej instrukcji w formacie windows hlp, lub html
podgląd wyników na ekranie (w notatniku)
dodanie pojedynczych warunków dodatkowych (np. wyszukiwanie według listy fraz)
zapisywanie do pliku tylko numerów linii w których wystąpiła fraza
pełniejsza obsługa plików wynikowych (możliwość samodzielnego zdefiniowania miejsca zapisu i nazwy pliku)
możliwość wyszukiwania tekstu w wielu plikach i kopiowanie ich do jednego pliku wynikowego
możliwość dodawania nowych prostych informacji do linii w zapisywanych plikach
dodanie obsługi skrótów klawiaturowych
możliwość kopiowania do pliku tylko wybranej kolumny (kolumn)
możliwość kopiowania jednej kolumny, jeśli w innej znajdują się określone dane

Poważniejsze modyfikacje to np.:

zapisywanie standardowych ustawień w plikach konfiguracyjnych (lub w rejestrze)
rozbudowa warunków jakie spełniają linie - wielokrotne warunki (lista fraz do wyszukania), dodanie zaprzeczenia (nieobecność frazy), warunki typu większe niż, mniejsze niż, użycie wieloznacznych wzorców - typu: *c?d, możliwość traktowania określonego pola jako liczby i zapisywanie (analizowanie danych) jako danych liczbowych, a także wykonywanie na nich działań arytmetycznych, zadanie warunków na długość linii (pliku wejściowego/wynikowego)
obsługa sekwencji separatorów - np. inny separator oddzielający kolumnę 1 szą od 2 giej,  niż 3 cią od 4-ej.
zapis warunków (ew. listy plików wejściowych) do pliku i ew. późniejsze wczytywanie tych warunków 
podgląd wyników na ekranie (w specjalnie dobudowanym edytorze)
stworzenie dodatkowych warunków do zapisu wyników typu: tylko 10 pierwszych, 10 najdłuższych linii, 
obsługa wielu plików na raz (z eksploratora i linii komend)
pełna obsługa z linii komend
możliwość listowania nagłówków kolumn (inne traktowanie pierwszego wiersza).
możliwość definiowania nagłówków kolumn i zapisywania ich w pliku
obliczanie zaawansowanych statystyk
możliwość wygenerowania nowych danych w zapisywanych plikach
eksport wybranych danych do tabeli html/plików tekstowych o zadanym formacie/tabeli MS Access mdb, MSExcell
inne - do uzgodnienia

Dodatkowe elementy związane z zamówieniem

Podmiot zamawiający program w rozszerzonej wersji otrzymuje licencję z prawami do zainstalowania programu na dowolnej liczbie komputerów do tego podmiotu należących oraz na komputerach osób współpracujących. Możliwe jest również dokupienie licencji na dystrybucję programu.

Inne usługi firmy prowadzonej przez autora programu

Inne usługi oferowane przez autora programu - Michała Dyszyńskiego i firmę Daktik.

szkolenia i nauka indywidualna (Obsługa Windows, Office, Podstawy obróbki grafiki i tworzenia stron www, program SPSS
realizacja różnych zleceń programistycznych
tworzenie instrukcji do obsługi programów komputerowych oraz sprzętu
tłumaczenia instrukcji (i innych tekstów) z języków - angielskiego, niemieckiego i rosyjskiego na język polski.
inne - do uzgodnienia, związane z twórczością autora na stronie http://www.daktik.rubikon.pl


Jeszcze o programie PoliczLinie

Program Logi.exe został napisany w MS Visual Basic 5.0 SP3. 

Program obsługuje technologię Drag&Drop - w celu wczytania pliku do przeszukania wystarczy przeciągnąć jego nazwę do okna otwartego programu. W aktualnej wersji program nie obsługuje wczytywania plików z linii komend.

Wszelkie błędy w działaniu programu proszę zgłaszać na adres autora: redakcja@fizykon.org .

 Ściągnij PoliczLinie