Tag Archives: ZendFramework

Sphinx 2 w systemie Debian – budowanie paczki ze źródeł

Przy budowaniu niewielkich serwisów obsługujących niewielką ilość dokumentów(artykuły, wpisy, komentarze, etc) zaprzęganie dedykowanych serwerów do przeszukiwania mija się z celem. Swoje projekty w dużej mierze buduję w oparciu o świetny phpowy framework Zend, który posiada bibliotekę Zend_Search_Lucene bardzo łatwo przyswajalną do budowy własnego mechanizmu wyszukiwania opartego na dokumentach.

Jak się okazuje to zendowskie Lucene nie jest wcale takie dobre, kiedy liczba dokumentów zacznie przekraczać kilkadziesiąt tysięcy. Najgorsze i najbardziej skomplikowane zapytania do indeksu(zoptymalizowanego oczywiście) trwały mi po 4 – 6 sekund i więcej! Niestety takie rozwiązanie nie może zostać przyjęte przez żaden chcący nawet szanować się serwis. Szukając zatem jakiegoś lepszego rozwiązania trafiłem na otwarto źródłowy serwer przeszukiwania Sphinx.

Sphinx jest w całości napisany w C++ i posiada wygodne API, które jest dostępne w większości popularnych języków do tworzenia aplikacji internetowych(tylko takie mnie interesują na chwilę obecną 😉 ). W oficjalnym serwisie chwalą się twórcy osiągnięciami wydajnościowymi swojego produktu i muszę przyznać, że są one naprawdę imponujące. Sam po wstępnych testach serwera(a teraz już w produkcji) muszę przyznać, że tak piekielnie szybkiego rozwiązania do przeszukiwania to jeszcze nie miałem :-).

Chyba wystarczająco dużo już posmarowałem Sphinxowi, czyli teraz czas przejść do konkretów – instalacji. Po przejściu w podstronę pobierania serwera widzimy, że mamy dostępnych kilka wersji serwera. Od razu co przyszło mi na myśl to pominięcie tych archaicznych wersji 0.XX i skupienie się na najnowszej, chociaż ciągle w fazie beta, wersji 2.XX. Widząc, że nie ma tam paczki dla Debiana(ani w repozytoriach) z najnowszą wersją doszedłem do wniosku, że sam sobie ją zbuduję, a co?! 🙂 Proces produkcji takowej paczki jest bardzo prosty i sprowadza się do kilku ruchów klawiaturą w konsoli 😉

1. Pobieramy źródła ze strony producenta do katalogu /usr/src i tam je rozpakowujemy:

# cd /usr/src 
# wget http://sphinxsearch.com/files/sphinx-2.0.1-beta.tar.gz 
# tar zxvf sphinx-2.0.1-beta.tar.gz

2. Instalujemy wymagane paczki do budowania pakietów Debiana:

# apt-get install build-essential fakeroot dpkg-dev dh-make

Wchodzimy następnie do katalogu ze źródłami i przygotowujemy je do zbudowania pakietu:

# cd 
sphinx-2.0.1-beta
 

# dh_make -f /usr/src/ sphinx-2.0.1-beta.tar.gz

 

Tutaj na pytanie o tym paczki odpowiadamy “s”(single binary), przy następnym pytaniu wciskamy ENTER i powinien naszym oczom ukazać się komunikat, że przygotowanie źródeł oryginalnych do specyfiki źródeł debiana powiodły się.

Opcja “-f” w tym przypadku mówi aplikacji dh_make aby jako archiwum źródeł oryginalnych wykorzystać te, które ściągnęliśmy na początku procesu budowy paczki.

Po przygotowaniu źródeł do budowy pakietu Debiana możemy wyedytować plik debian/control i wstawić tam swoje dane. Po czym przechodzimy do budowy paczki:

# dpkg-buildpackage -rfakeroot

Jeśli budowanie pakietu jest przeprowadzane na maszynie wielordzeniowej lub wieloprocesorowej to można w tym miejscu użyć opcji -jX(np.: -j8), gdzie X to liczba rdzenie, wątków lub procesorów, które posiadamy. Opcja ta jest analogiczna do tej, którą można spotkać w programie make.

W ostatnim etapie budowania pakietu dostałem błąd z “uber testa”, kombinować za dużo mi się nie chciało i żeby się go w miarę szybko pozbyć edytowałem plik ubertest.php:

# vim text/ubertest.php

i na samym początku skryptu dałem wyjście ze statusem 0

1 <?php

2 exit(0);

 

3 //
4 // $Id: ubertest.php 2765 2011-04-08 13:07:32Z klirichek $
5 //
6
7 $sd_managed_searchd = false;
8 $sd_skip_indexer = false;
9 $g_ignore_weights = false;

Po czym odpaliłem ponownie budowanie pakietu i tym razem proces budowania paczki przeszedł bez żadnych problemów do samego końca. W katalogu wyżej od teraz dostępny mam teraz przed momentem zbudowany pakiet z rozszerzeniem .deb, który przy pomocy dpkg można zainstalować i przejść do konfiguracji swojego serwera wyszukiwania.

Przykładem takiej konfiguracji może podzielę się kolejnym razem 🙂

 

Number of Views :3907

Zwracanie danych różnego typu poprzez serwer RPC

Pisząc interaktywną aplikację internetową, gdzie część komunikacji użytkownika z naszą aplikacją chcemy przenieść na stronę AJAXową z wykorzystaniem serwera RPC, możemy natrafić na konieczność zwrócenia tablicy danych zamiast powiedzmy pojedynczej wartości. W swojej pracy posługuję się jQuery i na tej bibliotece oprę swój opis. Do komunikacji z serwerem RPC wykorzystuję jsonRPC(źródło http://www.json.org/). Podstawowe biblioteki wyglądają mniej więcej tak:

[sourcecode language=’javascript’]
(function($)
{
/* strip html */
var regexp = /<("[^"]*"|'[^']*'|[^'">])*>/gi;
$.stripHtml = function (str){
return str.replace(regexp,””);
}
$.fn.stripHtml = function() {
this.each(function() {
$(this).html($.stripHtml($(this).html()));
});
return $(this);
}
/* jsonRpc */
$.jsonRpc = $.jsonRpc || function(options) {
var ajaxOptions = {
type: ‘POST’,
contentType: ‘application/json’,
dataType: ‘json’,
processData: false
};
var data = {
version: options.version || ‘2.0’,
method: options.method || ‘system.listMethods’,
params: options.params || [],
id: options.id || Math.round(Math.random()*10000)
};
$.each(data, function(i){ delete options[i] });
function send() {
options.data = JSON.stringify(data);
$.ajax($.extend(ajaxOptions, options));
}
if (typeof JSON == ‘undefined’) {
$.getScript(‘http://www.json.org/json2.js’, function(){ send() });
} else {
send();
}
return $;
}
})(jQuery);
/* JSON */
if (!this.JSON) {
JSON = {};
}
(function () {
function f(n) {
// Format integers to have at least two digits.
return n < 10 ? '0' + n : n; } if (typeof Date.prototype.toJSON !== 'function') { Date.prototype.toJSON = function (key) { return this.getUTCFullYear() + '-' + f(this.getUTCMonth() + 1) + '-' + f(this.getUTCDate()) + 'T' + f(this.getUTCHours()) + ':' + f(this.getUTCMinutes()) + ':' + f(this.getUTCSeconds()) + 'Z'; }; String.prototype.toJSON = Number.prototype.toJSON = Boolean.prototype.toJSON = function (key) { return this.valueOf(); }; } var cx = /[u0000u00adu0600-u0604u070fu17b4u17b5u200c-u200fu2028-u202fu2060-u206fufeffufff0-uffff]/g, escapable = /[\"x00-x1fx7f-x9fu00adu0600-u0604u070fu17b4u17b5u200c-u200fu2028-u202fu2060-u206fufeffufff0-uffff]/g, gap, indent, meta = { // table of character substitutions 'b': '\b', 't': '\t', 'n': '\n', 'f': '\f', 'r': '\r', '"' : '\"', '\': '\\' }, rep; function quote(string) { escapable.lastIndex = 0; return escapable.test(string) ? '"' + string.replace(escapable, function (a) { var c = meta[a]; return typeof c === 'string' ? c : '\u' + ('0000' + a.charCodeAt(0).toString(16)).slice(-4); }) + '"' : '"' + string + '"'; } function str(key, holder) { var i, // The loop counter. k, // The member key. v, // The member value. length, mind = gap, partial, value = holder[key]; if (value &amp;amp;amp;&amp;amp;amp; typeof value === 'object' &amp;amp;amp;&amp;amp;amp; typeof value.toJSON === 'function') { value = value.toJSON(key); } if (typeof rep === 'function') { value = rep.call(holder, key, value); } switch (typeof value) { case 'string': return quote(value); case 'number': return isFinite(value) ? String(value) : 'null'; case 'boolean': case 'null': return String(value); case 'object': if (!value) { return 'null'; } gap += indent; partial = []; if (Object.prototype.toString.apply(value) === '[object Array]') { length = value.length; for (i = 0; i < length; i += 1) { partial[i] = str(i, value) || 'null'; } v = partial.length === 0 ? '[]' : gap ? '[n' + gap + partial.join(',n' + gap) + 'n' + mind + ']' : '[' + partial.join(',') + ']'; gap = mind; return v; } if (rep &amp;amp;amp;&amp;amp;amp; typeof rep === 'object') { length = rep.length; for (i = 0; i < length; i += 1) { k = rep[i]; if (typeof k === 'string') { v = str(k, value); if (v) { partial.push(quote(k) + (gap ? ': ' : ':') + v); } } } } else { for (k in value) { if (Object.hasOwnProperty.call(value, k)) { v = str(k, value); if (v) { partial.push(quote(k) + (gap ? ': ' : ':') + v); } } } } v = partial.length === 0 ? '{}' : gap ? '{n' + gap + partial.join(',n' + gap) + 'n' + mind + '}' : '{' + partial.join(',') + '}'; gap = mind; return v; } } if (typeof JSON.stringify !== 'function') { JSON.stringify = function (value, replacer, space) { var i; gap = ''; indent = ''; if (typeof space === 'number') { for (i = 0; i < space; i += 1) { indent += ' '; } } else if (typeof space === 'string') { indent = space; } rep = replacer; if (replacer &amp;amp;amp;&amp;amp;amp; typeof replacer !== 'function' &amp;amp;amp;&amp;amp;amp; (typeof replacer !== 'object' || typeof replacer.length !== 'number')) { throw new Error('JSON.stringify'); } return str('', {'': value}); }; } if (typeof JSON.parse !== 'function') { JSON.parse = function (text, reviver) { var j; function walk(holder, key) { var k, v, value = holder[key]; if (value &amp;amp;amp;&amp;amp;amp; typeof value === 'object') { for (k in value) { if (Object.hasOwnProperty.call(value, k)) { v = walk(value, k); if (v !== undefined) { value[k] = v; } else { delete value[k]; } } } } return reviver.call(holder, key, value); } cx.lastIndex = 0; if (cx.test(text)) { text = text.replace(cx, function (a) { return '\u' + ('0000' + a.charCodeAt(0).toString(16)).slice(-4); }); } if (/^[],:{}s]*$/. test(text.replace(/\(?:["\/bfnrt]|u[0-9a-fA-F]{4})/g, '@'). replace(/"[^"\nr]*"|true|false|null|-?d+(?:.d*)?(?:[eE][+-]?d+)?/g, ']'). replace(/(?:^|:|,)(?:s*[)+/g, ''))) { j = eval('(' + text + ')'); return typeof reviver === 'function' ? walk({'': j}, '') : j; } throw new SyntaxError('JSON.parse'); }; } })(); [/sourcecode] Kolenym krokiem jest ustalenie kontrolera dla zapytań ajaxowych. Powiedzmy niech to będzie kontroler ajax. Warto zaznaczyć, że startowanie mechanizmu MVC w ZendFramework w mojej aplikacji odbywa się jeszcze w bootstrapie, w takim razie musimy wyłączyć mechanizm widoków i layout dla naszego kontrolera, aby zwracane dane były dokładnie tym co nas interesuje, a nie dodatkowy były opakowane w jakiś szablon layoutu. [sourcecode language='php'] class AjaxController extends Zend_Controller_Action { private $_server = null; public function init() { parent::init(); Zend_Layout::resetMvcInstance(); Zend_Controller_Front::getInstance()->setParam(‘noViewRenderer’, true);
$this->_server = new Zend_Json_Server();
}
}
[/sourcecode]

W metodzie init ustalam również iż nie będę wykorzystywał viewRenderera oraz tworzę nową instancję Zend_Json_Server. Kolejnym krokiem jest napisanie akcji w naszym kontrolerze. Będą to proste metody gdzie ustawimy klasy obsługujące poszczególne akcje

[sourcecode language=’php’]
public function answerAction()
{
$this->_server->setClass(‘Model_Ajax_Forest’);
}
public function postDispatch()
{
$this->_server->handle();
}
[/sourcecode]

dla akcji answer obsługę metod wywołania przerzucam na klasę Model_Ajax_Forest. W metodzie postDispatch zaczynam obsługę wywołania, chociaż równie dobrze mógłbym to zrobić w akcji answer, aczkolwiek takie rozwiązanie daje mi większą elastyczność.

Dla jasności klasa Model_Ajax_Forest to zwykła klasa z tym, że musi być udokumentowana, czyli każda metoda musi mieć komentarz do samej siebie jakie parametry przyjmuje jakich typów są to parametry oraz jakie typy wartości zwraca etc. przykładowa klasa może wyglądać tak:

[sourcecode language=’php’]
_zmienna = microtime();
}
/**
* Metoda zwraca sume i roznice dwoch parametrow.
*
* @param int $param1
* @param int $param2
* @return array
*/
public function pro($param1, $param2)
{
$sum = array($param1 + $param2, $param1 – $param2);
return $sum;
}
}
[/sourcecode]

powyższy przykład to prezentacja metody która może zwracać tablicę, ale tak naprawdę w naszym przypadku to rozwiązanie nie zadziała. Dlaczego? Odpowiedź jest zaskakująco prosta taki zapis:

[sourcecode language=’php’]
$zmienna = array(10, 20);
return $zmienna;
[/sourcecode]

to nie to samo co

[sourcecode language=’php’]
return array(10, 20);
[/sourcecode]

Otrzymany typ danych w metodzie do obsługi ajaxowego żądania jest determinowany przez typ znajdujący się za słowem kluczowym return w metodzie odpowiedzialnej za obsługę tego żądania. Mając powiedzmy taką metodę przypiętą do jakiegoś przycisku

[sourcecode language=’javascript’]

function handle(param1, param2)
{
jQuery.jsonRpc({
url: “/ajax/answer”,
method: “pro”,
params: [param1, param2],
success: function(data){
if(data.error) {
alert(data.error.message);
return;
}
else
{
if(data.result == false)
{
alert(“ERROR: Błąd systemu, proszę o kontakt z administracją”);
return;
}
alert(data.result[0];
alert(data.result[1];
}
},
error: function(data, status)
{
alert(“ERROR: “+data.responseText);
},
beforeSend: function()
{
}
});
}

[/sourcecode]

Otrzymamy błąd ponieważ oczekujemy otrzymania tablicy a w metodzie klasy Model_Ajax_Forest zwracamy zmienną tablicową a nie tworzoną dynamicznie tablicę. Pytanie które się nasuwa to dlaczego? Nie starając się wodzić kogokolwiek za nos przyznam szczerze, że nie wiem. Jak do tej pory nie byłem zmuszony dojść dlaczego tak się dzieje, również przez brak czasu tak naprawdę, ale jest to jedna z tych rzeczy, które oznaczam kategorią “ćwieków”. Cały czas w podświadomości siedzi to dlaczego i w wolnych chwilach staram się dojść do tego. Bardzo chętnię przyjmę komentarze wyjaśniejące cały procedens.

Jak idzie bardzo łatwo zauważyć, cały ciężar obsługi wywołania przenosimy na ZendFramework, który świetnie sobie z tym radzie, do nas tak naprawdę należy jedynie obsługa obróbki danych.

Number of Views :1581