This is a multi-part message in MIME format.
On 21/01/2023 12:49, ptilou wrote:
Bonjour,
J’attaque un travail dedroit compare, il y a pas que les [grands] informaticiens et donc je cherche un parser, mais ausi un stockage qui m’indexerai beaucoup de document texte ?
Je serais intéressé à comprendre de quel travail de droit comparé s'agit-il....
Pour l'analyse de texte on pourrait coder quelque chose en utilisant un générateur de parser comme GNU bison
<
https://www.gnu.org/software/bison/> ou ANTLR <
https://www.antlr.org/>
ou menhir <
https://gallium.inria.fr/~fpottier/menhir/> (qui est
français) ou Lemon <
https://www.sqlite.org/lemon.html>.
On peut aussi s'inspirer du code de certains shells en logiciel libre
(par exemple GNU bash <
https://www.gnu.org/software/bash/> ou zsh <
https://zsh.org/>) ou d'autres logiciels libres comme RefPerSys <
http://refpersys.org/> ou CAIA
<
https://github.com/bstarynk/caia-pitrat> ou Sqlite
<
https://www.sqlite.org/>.
Pour le stockage, je suggère d'utiliser une base de données en logiciel libre, par exemple PostGreSQL <
https://postgresql.org/> ou MariaDB <
https://mariadb.org/> ou Redis <
https://redis.io/> ou Sqlite <
https://www.sqlite.org/>.
MaxWeberEconomyAndSociety.pdf (archive.org), voila pourquoi je cherche le parser !
Pour l’indexation j’ai beaucoup de document je me demande si c’est pas possible que freeperso interoge et indexe des base comme legifrance ou hudoc ?
Je n'ai pas compris la question. Free <
https://portail.free.fr/> utilise
bien sûr des bases de données.
Et concernant vos documents, combien de documents (ou de gigaoctets ou
de petaoctets) voulez vous stocker?
La lecture du livre de Pierre Delort
<
https://www.linkedin.com/in/delort/>, collection _Que Sais-je_ au PUF,
sur le /Big Data/ serait probablement utile!
Librement.
--
Basile Starynkevitch<
[email protected]>
(only mine opinions / les opinions sont miennes uniquement)
92340 Bourg-la-Reine, France
web page: starynkevitch.net/Basile/
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
</head>
<body>
<p><br>
</p>
<div class="moz-cite-prefix">On 21/01/2023 12:49, ptilou wrote:<br>
</div>
<blockquote type="cite"
cite="mid:
[email protected]">
<pre class="moz-quote-pre" wrap="">Bonjour,
J’attaque un travail dedroit compare, il y a pas que les [grands] informaticiens et donc je cherche un parser, mais ausi un stockage qui m’indexerai beaucoup de document texte ?</pre>
</blockquote>
<p>Je serais intéressé à comprendre de quel travail de droit comparé
s'agit-il<tt>....</tt></p>
<p><br>
</p>
<p>Pour l'analyse de texte on pourrait coder quelque chose en
utilisant un générateur de parser comme <a moz-do-not-send="true"
href="
https://www.gnu.org/software/bison/">GNU bison</a> ou <a
moz-do-not-send="true" href="
https://www.antlr.org/">ANTLR</a>
ou <a moz-do-not-send="true"
href="
https://gallium.inria.fr/~fpottier/menhir/">menhir</a>
(qui est français) ou <a moz-do-not-send="true"
href="
https://www.sqlite.org/lemon.html">Lemon</a>.<br>
</p>
<p><br>
</p>
<p>On peut aussi s'inspirer du code de certains shells en logiciel
libre (par exemple <a moz-do-not-send="true"
href="
https://www.gnu.org/software/bash/">GNU bash</a> ou <a
moz-do-not-send="true" href="
https://zsh.org/">zsh</a>) ou
d'autres logiciels libres comme <a moz-do-not-send="true"
href="
http://refpersys.org/">RefPerSys</a> ou <a
moz-do-not-send="true"
href="
https://github.com/bstarynk/caia-pitrat">CAIA</a> ou <a
moz-do-not-send="true" href="
https://www.sqlite.org/">Sqlite</a>.<br>
</p>
<p><br>
</p>
<p>Pour le stockage, je suggère d'utiliser une base de données en
logiciel libre, par exemple <a moz-do-not-send="true"
href="
https://postgresql.org/">PostGreSQL</a> ou <a
moz-do-not-send="true" href="
https://mariadb.org/">MariaDB</a>
ou <a moz-do-not-send="true" href="
https://redis.io/">Redis</a>
ou <a href="
https://www.sqlite.org/">Sqlite</a>.</p>
<blockquote type="cite"
cite="mid:
[email protected]">
<pre class="moz-quote-pre" wrap="">
MaxWeberEconomyAndSociety.pdf (archive.org), voila pourquoi je cherche le parser !
Pour l’indexation j’ai beaucoup de document je me demande si c’est pas possible que freeperso interoge et indexe des base comme legifrance ou hudoc ?</pre>
</blockquote>
<p>Je n'ai pas compris la question. <a moz-do-not-send="true"
href="
https://portail.free.fr/">Free</a> utilise bien sûr des
bases de données.</p>
<p><br>
</p>
<p>Et concernant vos documents, combien de documents (ou de
gigaoctets ou de petaoctets) voulez vous stocker?</p>
<p><br>
</p>
<p>La lecture du livre de Pierre <a moz-do-not-send="true"
href="
https://www.linkedin.com/in/delort/">Delort</a>,
collection <u>Que Sais-je</u> au PUF, sur le <i>Big Data</i>
serait probablement utile!</p>
<p><br>
</p>
<p>Librement.<br>
</p>
<pre class="moz-signature" cols="72">--
Basile Starynkevitch <a class="moz-txt-link-rfc2396E" href="mailto:
[email protected]"><
[email protected]></a>
(only mine opinions / les opinions sont miennes uniquement)
92340 Bourg-la-Reine, France
web page: starynkevitch.net/Basile/
</pre>
</body>
</html>
--- SoupGate-Win32 v1.05
* Origin: fsxNet Usenet Gateway (21:1/5)