Computadores i estudis bíblics
també: Computadoras y estudios bíblicos
COMPUTADORES I ESTUDIS BÍBLICS. Per a aconseguir un nivell de detall útil amb un abast raonable, aquest article se centra en dues formes. Primer, es tracta d'estudis " bíblics" en el sentit estricte de l'estudi del text, excloent ANE.història, arqueologia i geografia. La informàtica té molt a oferir a aquestes disciplines auxiliars, i s'han desenvolupat algunes aplicacions impressionants, però el focus d'atenció comuna de tots els erudits bíblics és el text, i és allí on dirigim la nostra atenció. En segon lloc, aquest article és metodològic, no històric. Una història de l'aplicació de les computadores a la Bíblia beneficiaria als qui estudien estudis bíblics (en contrast amb la Bíblia mateixa), però el camp està progressant tan ràpidament que tal història quedaria immediatament desactualizada. A més, a causa dels avanços en les ciències de la computació, alguns dels projectes més importants històricament ofereixen poca orientació pràctica als qui planegen nous esforços de recerca en l'actualitat. En lloc de,
—
A. Introducció
B. Formular hipòtesi
1. Gramàtica de casos
2. Xarxes semàntiques
3. Anàlisi del discurs
4. Estructura modular
5. Gramàtica transformacional
C. Recopilar dades
1. Base de text
2. Programa de cerca
D. Analizar dades
1. Anàlisi qualitativa
2. Anàlisi quantitativa
E. Presentar resultats
1. Mitjans impresos
2. La computadora com a mitjà
—
A. Introducció
Com qualsevol altra ciència, l'exegesi implica formular hipòtesi, recopilar dades, analitzar aquestes dades a la llum de les hipòtesis i presentar resultats. Aquest ordre dels esdeveniments és només suggeridor, ja que les etapes posteriors amb freqüència requereixen la repetició de les anteriors. Per tant, a mesura que es recopilen dades, sovint es duu a terme una anàlisi informal al mateix temps, la qual cosa porta a una reformulació de les hipòtesis subjacents i una revisió del pla de recopilació de dades. Encara així, la divisió és útil per als nostres propòsits. La recopilació de dades sempre pressuposa alguna hipòtesi sobre el que és interessant o útil d'observar i el que no; l'anàlisi requereix dades sobre els quals operar; i la difusió eficaç dels resultats requereix un pas addicional una vegada finalitzat l'anàlisi.
En considerar cadascun d'aquests passos, veurem tant el que s'ha fet com el que es pot fer. No hi ha espai per a descriure cadascun dels centenars de projectes passats i presents, i l'esment d'un o omissió d'un altre no constitueix una recomanació o crítica. Les enquestes de projectes particulars en estudis bíblics assistits per computadora (Parunak 1989b; Hughes 1987) i altres estudis literaris (Patton i Holoien 1981), i la discussió de temes tècnics en el disseny de recerca per computadora per a les humanitats en general (Hoquei 1980), estan disponibles en altres llocs. Aquestes referències han de consultar-se per a obtenir informació detallada sobre els projectes i acadèmics nomenats però no documentats d'una altra manera en aquest article.
B. Formular hipòtesi
La ciència mai procedeix d'una tabula rasa. L'erudit sempre porta al text algun conjunt d'idees per a ser reivindicades o refutades. Quant més ben articulades estiguin aquestes hipòtesis, més eficaç serà el procés de recerca i menor serà el perill que les hipòtesis implícites perjudiquin els resultats.
La informàtica, i en particular les especialitats de les ciències cognitives i la intel·ligència artificial, han desenvolupat valuosos marcs teòrics per a descriure el llenguatge i el pensament. Basant-nos en aquests models, podem formular hipòtesis sobre el text bíblic amb major precisió del que era possible anteriorment. En cada exemple de la següent llista (no exhaustiva), analitzem com s'ha aplicat o es pot aplicar una idea de la informàtica als estudis bíblics.
1. Gramàtica de casos. La gramàtica de casos (Fillmore 1968; Cook 1979) és un model lingüístic que va sorgir dels primers treballs de traducció automàtica de les dècades de 1950 i 1960. La gramàtica de casos centra l'atenció en la relació entre verbs i substantius en oracions. Cada verb té associat un marc de cas, que és un conjunt d'espais de cas. Aquests espais de cas, encara que suggerits pels casos clàssics marcats en l'estructura superficial d'idiomes com l'alemany o el grec clàssic i el llatí, difereixen de manera important dels casos clàssics. La diferència central entre els casos en la gramàtica de casos i els casos clàssics és la que existeix entre l'estructura superficial d'un text i l'estructura profunda de significat que representa. El nivell superficial del llenguatge conté elements com a verbs, substantius i casos (clàssics). El món del significat s'ocupa d'accions, entitats i casos (gramàtica de casos). La relació entre aquestes capes està esbiaixada, de manera que, per exemple, un substantiu en el nivell de la superfície (com a "mort") en realitat representa una acció en el nivell profund. Els casos de gramàtica de casos descriuen els rols que compleixen les entitats respecte a les accions en el nivell profund. Per exemple, els espais de casos comunament utilitzats inclouen agent (el que realitza l'acció), experimentador (el que se sotmet a l'acció) i beneficiari (el que es beneficia de l'acció). Els espais de cas es caracteritzen per tant semànticament, en contrast amb els casos de nivell superficial (clàssics) (com a nominatiu, datiu, genitiu, acusatiu, vocatiu), que són sintàctics. Els casos de gramàtica de casos descriuen els rols que compleixen les entitats respecte a les accions en el nivell profund. Per exemple, els espais de casos comunament utilitzats inclouen agent (el que realitza l'acció), experimentador (el que se sotmet a l'acció) i beneficiari (el que es beneficia de l'acció). Per tant, els espais de cas es caracteritzen semànticament, en contrast amb els casos de nivell superficial (clàssics) (com a nominatiu, datiu, genitiu, acusatiu, vocatiu), que són sintàctics. Els casos de gramàtica de casos descriuen els rols que compleixen les entitats respecte a les accions en el nivell profund. Per exemple, els espais de casos comunament utilitzats inclouen agent (el que realitza l'acció), experimentador (el que se sotmet a l'acció) i beneficiari (el que es beneficia de l'acció). Els espais de cas es caracteritzen per tant semànticament, en contrast amb els casos de nivell superficial (clàssics) (com a nominatiu, datiu, genitiu, acusatiu, vocatiu), que són sintàctics.
Pel fet que els verbs de nivell superficial corresponen aproximadament a accions d'estructura profunda, es poden associar espais de casos d'estructura profunda amb els verbs corresponents a les accions associades. Els verbs difereixen en les caselles que tenen. Per exemple, "fer mal" té un experimentador però no un agent; "Copejar" té tots dos. A nivell de superfície, un sol cas clàssic pot correspondre en diferents ocasions a diferents casos d'estructura profunda. Així, l'experimentador de "fer mal" i l'agent de "copejar" estan tots dos representats per una estructura superficial nominativa, mentre que l'experimentador de "copejar" presa una estructura superficial acusativa.
A diferència dels casos d'estructura de superfície, els espais de caixa són invariables sota canvis de veu o canvis com els generats per inflexió. Per exemple, tant en l'oració activa "El nen va copejar la pilota" com en la passiva "La pilota va ser copejada pel nen", "nen" és agent i "pilota" és experimentador.
La gramàtica de casos ofereix als estudis bíblics un marc teòric rigorós per a la lexicografia. Una vegada que reconeixem que els marcs de casos no varien amb la inflexió verbal, però sí que varien amb la semàntica del verb, podem usar-los per a classificar el vocabulari d'un idioma. Resulta tant natural com provocatiu classificar els verbs sobre la base dels marcs dels casos i les classes semàntiques de paraules que poden omplir-los, o classificar els substantius sobre la base dels espais entre majúscules i minúscules que poden omplir. Atès que els espais entre majúscules i minúscules són un fenomen d'estructura profunda, ofereixen una base teòrica per a combinar l'evidència semàntica proporcionada pels verbs amb la dels substantius verbals associats, on els espais entre majúscules i minúscules solen aparèixer com a genitius superficials.
2. Xarxes semàntiques. El terme xarxes semàntiques (Brachman i Levesque 1985) es refereix a una varietat de models de significat, tots caracteritzats per una col·lecció de nodes (que representen conceptes) i relacions entre ells. La recerca en intel·ligència artificial (IA) ha demostrat que les computadores han de poder modelar grans fragments de coneixement sobre el món per a funcionar de manera intel·ligent. Una forma eficaç d'emmagatzemar aquest coneixement és com una xarxa de conceptes connectats per relacions. Dos tipus de conceptes ( classe i instància ) i dos tipus de relacions ( AKO i ISA ) són comunes als molts esquemes individuals que s'han proposat.
Un concepte d'instància correspon a una sola entitat en algun món, real o imaginari, mentre que una claseconcepto és una prova que es pot aplicar a qualsevol entitat i dirà "sí" si l'entitat és membre del concepte, o "no" en cas contrari. Des d'una altra perspectiva, un nomena instàncies però descriu classes. Per exemple, David, Saúl i Salomón serien instàncies en una xarxa semàntica que representa el món conceptual de la Bíblia hebrea, mentre que -rei d'Israel- seria una classe. Una classe pot tenir només un membre i continuar sent una classe en lloc d'una instància si la seva funció és descriure en lloc de nomenar. Així, "creador" és una classe l'únic membre de la qual en el pensament bíblic ortodox és la instància YHWH. Un pot fins i tot tenir una classe sense membres (per exemple, novament en el pensament bíblic ortodox, la classe "déus distints de YHWH").
Les relacions AKO ("una espècie de") s'uneixen a classes relacionades, mentre que les relacions ISA ("és un") assignen instàncies a les classes. Per exemple, el concepte "Profeta" s'uneix al concepte "Persona" amb una cadena d'enllaços AKO, ja que "Profeta" és una subclasse de "Persona". (És a dir, qualsevol cosa que un pugui descriure com a "Profeta" també pot descriure's com a "Persona"). "Persona" al seu torn és AKO "ser vivent". Per a identificar a un individu específic (com Isaïes o Jeremies) com a profeta, un enllaç ISA connecta la instància corresponent a #aqueix persona amb la classe "Profeta".
Les xarxes semàntiques tendeixen a consistir en xarxes de classes que mostren les relacions entre conceptes amb una franja d'instàncies que pengen del fons. Per exemple, l'Annex 1 ( Fig.com.01) mostra un fragment d'una xarxa semàntica arrelada en el concepte "Ésser viu". Els nodes impresos en lletra clara són totes classes, relacionades entre si mitjançant enllaços AKO (indicats per fletxes en negreta). En la part inferior, en negreta, hi ha instàncies específiques, vinculades a les seves classes més específiques per enllaços ISA (fletxes discontínues). A més dels enllaços que realment es mostren en el diagrama, la lògica de les xarxes semàntiques ens permet deduir que "Persona justa" és AKO "Persona" (ja que qualsevol cadena d'enllaços AKO és equivalent a un sol enllaç AKO) i "David" ISA -Ésser viu- (atès que una instància d'una classe és també una instància de qualsevol altra classe de la qual la primera és una subclasse).
Les relacions AKO i ISA són les més comunes, però no són suficients per a un modelatge semàntic complet. Les relacions addicionals entre classes (com a part d'i color de ) sovint s'inventen ad hoc per a satisfer una necessitat particular, però poden derivar-se d'una manera teòricament més satisfactòria a partir dels marcs de casos de la gramàtica de casos.
Les xarxes semàntiques ofereixen una metodologia i un marc per a descriure un espai semàntic i estudiar el lloc de diversos conceptes dins d'ell. Juntament amb la gramàtica de casos, són una eina important per a formalitzar la lexicografia. També ofereixen un model poderós per a estudiar fenòmens com el paral·lelisme semàntic en la poesia bíblica.
Una teoria popular del paral·lelisme atribueix l'aparellament repetit d'uns certs elements lèxics a l'existència d'una tradició convencional de parells dels quals els poetes van extreure coincidències acceptables. Si recopilem els parells aparellats de la poesia ugarítica o del llibre de Proverbis i ordenem les paraules en un full de paper de tal manera que la distància entre dues paraules sigui proporcional a la freqüència amb la qual #aqueix paraules apareixen en paral·lel, el patró general cau en regions clarament delineades, cadascuna amb la seva pròpia integritat semàntica, i l'associació de parells individuals es veu com només un detall de la imatge més àmplia de regions de termes associats. Tal patró s'explica fàcilment amb la hipòtesi que els humans emmagatzemen el seu inventari de conceptes com una xarxa i tendeixen a associar termes (ja sigui com a paral·lels poètics o d'altres formes) en funció de la seva proximitat en la xarxa general. Aquesta xarxa general és el context més ampli dins del qual han de discutir-se les teories sobre els parells tradicionals.
Per exemple, l'Annex 2 ( Fig.com.02) distribueix 66 substantius en dues dimensions de tal manera que com més a prop estan dues paraules en la pàgina, més sovint apareixen com a paral·lels poètics entre si en Proverbis. Diverses regions semàntiques clares són visibles. El quadrant superior esquerre, que s'estén cap a l'inferior esquerre, està dominat pels noms de les parts del cos. Els que estan a la dreta del grup són els òrgans de la saviesa i la moralitat, com a "ànima", "cor" i "esperit", mentre que els de l'esquerra són purament físics, com a "peu", "ull" i " mà." En la part superior, paraules com "Sheol", "mort", "durada", "dia", "riqueses" i "honor" reflecteixen les conseqüències de diversos estils de vida. Una regió vertical prop del centre conté substantius que descriuen éssers racionals (inclòs "Senyor", dues paraules per a "home", "fill", "pecador" i "escarnecedor"). També conté adjectius que s'usen comunament com a substantius que identifiquen a les persones, com a "savi" i "just". Els termes en la part inferior de la columna descriuen a les persones respecte a la seva condició moral, mentre que els de la part superior reflecteixen saviesa i insensatesa. Aquesta columna uneix altres dos grups, un de termes de saviesa i l'altre de termes de moralitat. La resta de les paraules en el quadrant superior dret són els noms de saviesa i enteniment, així com el seu oposat, "bogeria". -Por- és aquí a causa de la seva freqüent aparició en la frase, -temor de Jehová-, que és (com a Proverbis ens recorda sovint) el començament de la saviesa. Els termes cap a l'extrem inferior dret d'aquest grup, com a "consell", "disciplina" i "reprensió", es refereixen a la comunicació de la saviesa. A l'altre costat del fons, fusionant-se amb les paraules morals per a éssers racionals, són descripcions de la moralitat i les seves manifestacions, incloent-hi "orgull", "perversitat", "rectitud" i diverses metàfores ("camí", "camí" i "camí") que descriuen el curs de la vida d'una persona. L'existència de tals regions és una prova convincent que els parells paral·lels no són una fi estilística en si mateixos, sinó la vora de tot un teixit d'interrelacions semàntiques, com suggereix un model de xarxa semàntica.
L'observació que el segon membre d'una parella poètica sovint intensifica, enforteix o fa més específica la idea del primer membre (Alter 1985) reflecteix la importància en general de les relacions AKO en l'estructura dels espais conceptuals.
3. Anàlisi del discurs. Cada exegeta ha diagramado oracions per a analitzar les relacions entre paraules dins de clàusules. Recentment, ha augmentat l'interès per l'anàlisi del discurs, que estudia les relacions entre clàusules i unitats lingüístiques més àmplies. Gran part de l'ímpetu d'aquest estudi ha sorgit dels treballadors de la intel·ligència artificial, que busquen construir models formals per als processos computacionals subjacents al llenguatge humà. Una metodologia particularment útil, anomenada "teoria de l'estructura retòrica", es va desenvolupar específicament per a permetre que les computadores produeixin text que soni natural per als humans (Mann i Thompson 1987). La comunitat de traducció de la Bíblia també ha fet contribucions importants (Beekman i Callow 1974; Longacre 1976; Grimes 1975), però la motivació subjacent per a aquest treball, com per a tanta recerca en la teoria lingüística moderna, és el moviment cap a models formals de comportament inspirat en la informàtica.
La contribució de l'anàlisi del discurs que es destaca aquí és la definició formal d'un conjunt de relacions que les clàusules tenen entre si. De manera informal, algunes d'aquestes relacions (com la raó o els mitjans) són categories exegètiques familiars. Les contribucions més recents ofereixen conjunts d'aquestes relacions molt més complets que els que els exegetes estan acostumats a utilitzar (més de cinquanta en alguns sistemes). Proporcionen una teoria subjacent per a aquestes relacions (en un cas, basant-se en el càlcul proposicional per a definir-les amb precisió). També mostren com aquestes relacions entre clàusules poden estendre's a relacions entre unitats textuals encara més grans, proporcionant així una teoria coherent de l'estructura del discurs en tots els nivells, des de la clàusula fins al text complet.
4. Estructura modular. L'estudi de l'arquitectura literària, rastrejant patrons de repetició dins dels textos i estudiant fenòmens com el quiasme, l'alternança i les transicions formals (Parunak 1979, 1981b, 1983), es remunta molt abans de la computadora, i es va originar en els estudis de Lowth sobre el paral·lelisme del vers hebreu. La informàtica ofereix coneixements que poden enfortir i aclarir les anàlisis arquitectòniques dels textos.
A mesura que els programes de computadora s'han tornat més llargs i complexos, els nous llenguatges de computadora han proporcionat ajudes d'estructuració sofisticades per a permetre que el programa es construeixi com una sèrie de segments, cadascun amb la seva pròpia identitat i funció. Sense aquesta modularización, la gent no pot entendre els programes llargs i els errors es tornen difícils de trobar i corregir. Les estructures del programa són una adaptació a les limitacions cognitives humanes. Tant un programa estructurat com un no estructurat poden produir el mateix resultat, però l'estructurat és més fàcil d'entendre i manipular per a les persones. El desenvolupament de l'estructura en els llenguatges informàtics és, per tant, una finestra a l'estructura cognitiva humana en general i proporciona un model per a analitzar altres productes de la cognició humana, com els textos literaris estesos.
Per exemple, una regla bàsica en la programació estructurada és el principi de localitat d'accés. Les variables utilitzades dins d'un mòdul d'un programa no han de ser susceptibles de ser canviades per un altre mòdul tret que el mòdul que les posseeix les faci disponibles explícitament. Aquesta regla reflecteix la necessitat de la ment d'empaquetar el pensament en unitats relativament independents i de controlar les interaccions entre aquestes unitats per a reduir la complexitat. Els estudis d'arquitectura literària han identificat una sèrie de tècniques per a definir unitats textuals, però les anàlisis resultants sovint són criticats per observacions que una característica (com un element de vocabulari o una forma gramatical) apareix en diverses unitats, fora del patró general de repetició. . El principi de localitat suggereix que tal repetició no té per què invalidar l'estructura modular general, ja que les característiques que són locals per a mòduls individuals no interactuen entre si. Clarament, aquest enfocament requereix refinament per a indicar sota quines condicions una característica pot considerar-se local i quines tècniques utilitza un mòdul per a fer una característica disponible públicament per a establir relacions amb altres mòduls. Amb la mateixa claredat, tot el marc dins del qual es planteja la hipòtesi, i les direccions al llarg de les quals pot ser provada i refinada, són el resultat de tendències cognitives que han quedat clares en els nostres intents de programar computadores.
5. Gramàtica transformacional. Ja hem assenyalat la contribució indirecta dels primers esforços de traducció automàtica a la teoria lingüística en forma de gramàtica de casos. Una altra contribució important d'aquests esforços és la gramàtica transformacional, desenvolupada per Noam Chomsky com a resultat dels estudis de les estructures formals dels llenguatges matemàtics. La gramàtica transformacional modela com una única representació semàntica d'una idea dins de la ment pot emergir com a diferents corrents de text. Per exemple, explica com les formes passiva i activa d'una oració es relacionen amb un únic significat subjacent.
Aquesta teoria gramatical en particular ha estat útil en diversos estudis recents sobre el paral·lelisme poètic hebreu (Collins 1978; O’Connor 1980; Geller 1979), on ha proporcionat un marc per a classificar i analitzar estructures poètiques paral·leles amb molta més discriminació de la que havia estat disponible prèviament. . Permet a l'analista identificar el paral·lelisme no sols entre paraules en la forma superficial del text, sinó també entre elements en l'estructura subjacent o profunda, i per tant proporciona una base teòrica per a estendre l'aplicació del paral·lelisme a moltes línies poètiques que en el nivell superficial no exhibeixen paral·lelisme formal.
C. Recopilar dades
Amb una hipòtesi a la mà, volem recopilar dades del text per a provar-lo. En els dies anteriors a les computadores, els erudits bíblics recopilaven les seves dades mantenint notes ad hoc sobre diversos temes trobats durant la lectura general del text; llegint el text mentre busca un fenomen específic; o mitjançant concordances. La computadora va ser reconeguda des del principi com una manera d'accelerar aquest procés. Hi ha dotzenes de programes disponibles per a donar suport a la fase de recopilació de dades de l'exegesi, massa perquè intentem revisar-los detalladament aquí. Hughes (1987) ofereix un bon estudi. Esmentarem alguns que il·lustren algunes de les capacitats que descrivim.
Els dos components bàsics de qualsevol sistema informàtic per a recopilar dades del text bíblic són la base de text en si i un programa de cerca que manipula aquesta base de text. (Aquests corresponen respectivament a la Bíblia i a l'erudit en l'escenari anterior a la computadora). La base de text conté almenys el text a estudiar, que pot estar en els idiomes originals, traduccions o tots dos. (Alguns programes, com el programa Bible Word d'Akiyama, permeten als usuaris consultar diverses versions del mateix text simultàniament). Sovint inclou anotacions en el text i, a vegades, proporciona índexs que acceleren el procés de cerca. El programa de cerca és responsable de recopilar les especificacions de l'usuari per a una cerca, aplicar-les a la base de text i retornar els resultats a l'usuari en una forma útil.
Els sistemes de recopilació de dades difereixen àmpliament en el que s'inclou en la base de text, com s'emmagatzema i com el programa de cerca el manipula. Alguns objectius es poden aconseguir en la base de text o en el programa de cerca. Per exemple, si un necessita recuperar verbs d'acord amb la seva anàlisi, es pot codificar cada verb en la base de text amb la seva anàlisi o, alternativament, proporcionar al programa de cerca la capacitat d'analitzar els verbs a mesura que els adquireix. En general (però amb moltes excepcions específiques), és més ràpid emmagatzemar una anàlisi lingüística en la base de text que calcular-ho durant la cerca, però una estratègia d'anàlisi emmagatzemada requereix més espai per a la base de text (per exemple, una unitat de disc dur més gran). ) que un que analitza sobre la marxa. A mesura que les computadores es tornen més ràpides i les tecnologies d'emmagatzematge d'alta densitat (com a CD-ROM) es tornen menys costoses,
1. Base de text. Les bases de text es diferencien entre si pel detall amb el qual representen el text bàsic, la representació de les anotacions i l'estratègia d'emmagatzematge.
un. Detall de Representació. El grau de detall que ha de representar-se en un text codificat varia segons el propòsit al qual es destina el text. En molts projectes inicials, els textos es van codificar amb un propòsit específic en ment. Per exemple, els acadèmics interessats en estudis lèxics i sintàctics de l'Antic Testament amb freqüència ignoren la cantilación del text i, sovint, no el codifiquen en la seva base de text. Algunes bases de text hebreu fins i tot exclouen la vocalització. El llenguatge de cerca GRAMCORD (Miller 1984) no es basa en l'accentuació del text grec, per la qual cosa la base del text no registra aquesta accentuació. Algunes edicions informàtiques populars de la KJV no distingeixi les paraules en cursiva (les inserides pels traductors per a suavitzar la sintaxi en anglès) de la resta del text.
Dins del context d'un projecte de recerca individual amb objectius restringits, els textos parcials poden reduir el cost de registrar les dades i controlar els requisits d'emmagatzematge. A més, sovint és més fàcil dissenyar programes de cerca si la base de text no està abarrotada d'informació (com cantilación o accentuació) que el programa de cerca no utilitza. No obstant això, amb massa freqüència, un investigador que ha codificat només algunes característiques d'un text troba noves preguntes que sorgeixen en el curs de la recerca que requereixen accés a les característiques omeses. A mesura que augmenta la capacitat d'emmagatzematge i les computadores creixen més ràpid, i a mesura que els textos s'acoblen per a ús general en repositoris com el Centre d'Anàlisi Computacional de Textos de la Universitat de #Pensilvània i el Servei de Computació de la Universitat d'Oxford (per nomenar només dues) en lloc de ser codificat a mesura per a projectes específics,
B. Anotacions. Moltes preguntes exegètiques involucren la forma analitzada de les paraules, més que la forma en què apareixen en un text. Per exemple, si un està buscant "mouse" en un text, sovint es desitja recuperar al mateix temps les aparicions de la forma plural "mouse". Encara que el text conté la cadena de caràcters "mouse", l'analista pot voler manipular-lo com si tingués la notació "mouse + plural". Aquesta anàlisi registra la -forma de diccionari- de la paraula (l'entrada en un diccionari que es consultaria per a trobar informació sobre la paraula) i el seu codi gramatical o d'anàlisi sintàctica. La forma del diccionari també es denomina a vegades "lema" (plural "lemata") i un text que indica explícitament la forma del diccionari de cada paraula es denomina "text lematizado".
Hi ha menys necessitat de lematització en anglès que en grec i hebreu. Les paraules en anglès canvien comparativament poc en diferents contextos. Els plurals interns (com a "ratolins") són molt més rars que els que es formen agregant un sufix simple ("cases"), i els substantius no tenen formes diferents en la posició de subjecte, objecte i objecte indirecte. Els verbs generalment conserven la seva forma bàsica, amb temps, persona i aspecte marcats a través de terminacions simples i verbs auxiliars. Per tant, un programa de cerca d'anglès pot recuperar diverses inflexions d'una paraula desitjada simplement especificant la part inicial que és comuna a les diverses formes de la paraula.
Aquesta estratègia té menys èxit en grec i hebreu. L'ús intensiu de prefixos i sufixos en els paradigmes verbals, i l'ús aglutinant de l'hebreu de preposicions i articles amb prefixos i pronoms posfijados, juntament amb la característica ortogràfica menys regular dels textos que van circular en els segles anteriors a la impressió, dificulten la recuperació amb una sola cerca. modelar totes les paraules que el diccionari classifica juntes.
En principi, el programa de cerca pot realitzar l'anàlisi. Després de tot, així és com la gent llegeix els textos. No obstant això, els mecanismes que utilitzen les persones encara no es comprenen perfectament, i el que sabem sobre ells mostra que depenen del context i fins i tot del coneixement general del món per a resoldre les ambigüitats de l'anàlisi sintàctica. Per tant, la majoria dels sistemes que permeten la recuperació per lema o anàlisi gramatical codifiquen l'anàlisi sintàctica en la base del text. Alguns sistemes (Morris i James 1975) registren sol lemes i codis gramaticals i ometen per complet la forma textual de les paraules. Uns altres registren la forma textual de cada paraula juntament amb un codi que indica la seva anàlisi gramatical (Friberg i Friberg 1981), i altres inclouen també lemes per a algunes (Miller 1984) o totes (Radday 1973) paraules.
Les bases de text analitzat disponibles actualment registren informació a nivell de superfície. S'ha codificat un esquema de cas rudimentari d'estructura profunda per a alguns llibres de l'AT i és útil per a emmarcar preguntes de la forma, "Enumeri tots els verbs que prenen a Déu com a pacient". Si s'augmenta la base d'un text amb una xarxa semàntica que modela el món conceptual de la comunitat dins de la qual el text va circular originalment, llavors es poden plantejar preguntes de la forma: "Què ha de dir aquest text sobre la moralitat?" Fins i tot si la paraula "moralitat" mai apareix en el text mateix, la xarxa semàntica permet la identificació de subclasses del concepte "moralitat", i la recuperació pot llavors buscar els noms d'aquests conceptes més específics. Per exemple, a una base de text augmentada amb la xarxa semàntica de l'Annex 1 se li podria demanar que enumerés tots els verbs els agents dels quals eren persones rectes,
Un inconvenient de les bases de text àmpliament analitzades és la necessitat de grans quantitats d'emmagatzematge per a registrar l'anàlisi. No tots els investigadors requereixen els mateixos tipus d'anàlisis, i una base de text prou detallada per a satisfer les necessitats de tots els investigadors pot requerir tant d'emmagatzematge que cap investigador pot permetre's accedir a ella. L'anàlisi " adaptativa" és una estratègia per a abordar aquest problema. En aquesta estratègia, el motor de cerca pot recuperar una anàlisi sintàctica d'una anotació emmagatzemada en la base del text o (més lentament) mitjançant el càlcul de la forma textual únicament. Les anàlisis especialitzades s'obtenen per càlcul però, una vegada trobats, s'agreguen a la base de text com a anotacions. Per tant, a mesura que s'usa el sistema, es torna més eficient en la recuperació dels tipus d'informació que l'usuari ha sol·licitat en el passat i es converteix en un assistent de recerca altament personalitzat.
C. Estratègia d'emmagatzematge. En un sistema de recuperació ben dissenyat, els detalls de com s'emmagatzema el text en la computadora estan ocults a l'usuari. No obstant això, per a comprendre com funcionen els programes de cerca i per a rastrejar les diferències entre diversos programes, és útil comprendre tres aspectes relacionats amb la representació i l'emmagatzematge textuals: esquemes de transcripció, indexació i compressió.
La primera característica del grec i l'hebreu que sorprèn el principiant de parla anglesa és que usen alfabets diferents als de l'anglès. Col·loquen els caràcters no sols alineats entre si, sinó un damunt i sota l'altre, i l'hebreu fins i tot escriu "al revés", de dreta a esquerra en lloc de de esquerra a dreta. Com es representen #aqueix característiques dins de la computadora?
Encara que la persona mitjana pensa que la interacció amb les computadores es duu a terme en l'alfabet romà, aquest alfabet no és més natural per a la computadora que qualsevol altre. Internament, les computadores modernes representen cada caràcter com una cel·la de memòria (anomenada "byte") que conté un número del 0 al 255. Per a emmagatzemar la lletra A en un byte, la computadora col·loca el número 65 allí. Per a emmagatzemar el caràcter 3 (no confondre amb el número 3), la computadora usa el número 51. Fins i tot l'espai en blanc té un número assignat (32). Aquesta associació entre números i caràcters és completament arbitrària. Per a representar hebreu o grec, els números s'assignen a caràcters hebreus o grecs en lloc de romans. Atès que els primers programes sol podien mostrar caràcters romans, els esquemes d'assignació per a hebreu i grec generalment assignen caràcters a números que també representen lletres romanes que recorden a la lletra hebrea o grega. Per exemple, Heb beth i Gk beta generalment es representen amb el mateix número que representa el caràcter romà b. En alguns casos (com els accents hebreus), dos bytes junts representen un sol caràcter. Internament, la computadora no distingeix entre -dreta- i -esquerra-, i un terminal adequadament programat pot imprimir hebreu de dreta a esquerra amb la mateixa facilitat amb què un convencional imprimeix anglès d'esquerra a dreta. Alguns programes, com Bible Word, LBase i la utilitat GRAMGREEK de GRAMCORD, poden mostrar i imprimir text en fonts hebrees i gregues, així com en transliteració.
La Bíblia és un text bastant extens. La KJV, per exemple, conté al voltant de 4.500.000 caràcters, o gairebé 800.000 paraules, en forma no lematizada. L'addició de lemes o codis gramaticals pot duplicar aquesta xifra. Buscar un text d'aquest tipus fent que la computadora el llegeixi seqüencialment pot ser una activitat que requereix molt temps, especialment si es busca un patró complex.
Per a accelerar una cerca, alguns programes segueixen l'exemple dels lectors humans, que normalment busquen un passatge que conté una paraula en particular buscant la paraula en una concordança. Una concordança és un exemple d'índex. Donat l'element d'interès, el guia directament als llocs del text que esmenten #aqueix element. De la mateixa manera, alguns sistemes de recuperació bíblica usen índexs del text per a accelerar el processament. Alguns sistemes permeten als usuaris crear els seus propis índexs a partir de cerques seqüencials i utilitzar-los per a accelerar les cerques futures. Aquesta tàctica és una versió simple de l'estratègia d'anàlisi adaptativa descrita anteriorment.
La grandària de la Bíblia requereix importants recursos d'emmagatzematge extern. A més, una de les operacions més lentes en una computadora és llegir informació de l'emmagatzematge extern en la memòria, per la qual cosa la grandària del text alenteix el processament. Per a evitar aquests problemes, molts sistemes comprimeixen el text. Un esquema popular consisteix a reemplaçar seqüències comunes de lletres en el text amb codis de bytes especials que no s'utilitzen per a caràcters ordinaris. Per exemple, si cadascuna de les 930 aparicions de "Jesús" en el NT s'emmagatzemés com un sol caràcter, es podrien guardar 3720 caràcters. Els esquemes de compressió com aquest so una de les raons per les quals s'ha d'accedir als arxius de dades utilitzades per molts sistemes de recuperació populars amb els seus programes de cerca associats i no es poden manipular amb un processador de text estàndard.
2. Programa de cerca. La base de text és de relativament poca utilitat sense un programa de cerca per a recuperar informació d'ella. Els programes de cerca van des de llenguatges de manipulació de text d'ús general (com SNOBOL, Icon, awk o grep) que poden processar qualsevol arxiu ASCII fins a programes adaptats a les necessitats dels erudits bíblics. El seu objectiu és produir llistes, recomptes i índexs de passatges que compleixin amb els criteris establerts per l'usuari. Les seves diferències més importants estan en la flexibilitat que té l'usuari per a descriure els passatges que es recuperaran, comptar o indexar. Aquestes diferències concerneixen tant les entitats a partir de les quals es construeix un patró de cerca com als tipus de restriccions entre aquestes entitats que l'usuari pot especificar.
un. Entitats de cerca. Cada base de text conté caràcters, i els llenguatges generals de manipulació d'arxius tracten els caràcters com la seva entitat bàsica. Els patrons de caràcter són generals i flexibles, però la majoria de les preguntes exegètiques no es plantegen a nivell de personatges sinó en termes d'entitats de nivell superior, com a morfemes, frases, clàusules o formes literàries. Un programa de cerca que manipula text a nivell de caràcters requereix que l'usuari tradueixi les sol·licituds de cerca dels objectes de major nivell d'interès exegètic en patrons de caràcters de baix nivell. Un programa que manipula explícitament agrupacions de nivell superior és més fàcil d'usar. Si una base de text està lematizada, es necessita un programa de cerca que comprengui les diferències entre el text, el lema i les anotacions d'anàlisis per a aprofitar-lo al màxim. Una implementació particularment flexible de tal esquema és LBase de Silver Mountain,
B. Restriccions del patró. Un programa de cerca proporciona a l'usuari un llenguatge per a definir relacions entre les entitats que reconeix. Una descripció redactada en aquest idioma es denomina patró, i les entitats amb les quals el patró coincideix en el text són els seus objectius. Algunes formes de patrons requereixen que el text es divideixi en segments (típicament, línies, oracions o versos) dins dels quals s'ha de satisfer un patró.
La forma més simple de patró és una llista fixa. Per tant, el patró de caràcters "morir" coincidiria amb totes les cadenes de caràcters que incloguin aquests caràcters en aquest ordre, inclosos "morir" i "van morir" (que l'usuari probablement desitja), i també "audiència" (que probablement no es desitja). Una llista fixa no ofereix cap manera de recuperar tant "de Déu" com "del nostre Déu" amb un sol patró. Cada personatge del patró ha de coincidir amb un personatge de l'objectiu i en el mateix ordre.
Una millora comuna dels patrons fixos són les combinacions booleanes. Aquest esquema permet a l'usuari construir un patró a partir de dos o més patrons més simples (com a llistes fixes) i especificar que han d'aparèixer dos patrons, o que ha d'aparèixer l'un o l'altre de dos, en un objectiu acceptable. Per exemple, el patró "amor" i "Déu" coincidiria amb cada segment que contingui tant la cadena "amor" com la cadena "Déu". Així recuperaria "l'amor de Déu" i "estimaràs al Senyor el teu Déu", i també "van estimar la lloança dels homes més que la lloança de Déu".
El següent nivell de complexitat després de les combinacions booleanes permet a l'usuari restringir l'ordre en el qual ocorren els sub-objectius i el material que pot ocórrer entre ells. El dispositiu més comú per a aquest propòsit és una espècie de "comodí". Per exemple, el patró "." s'usa comunament per a coincidir amb qualsevol caràcter, i * coincideix amb qualsevol seqüència de zero o més ocurrències del caràcter anterior. Llavors, el patró "de. * Déu" coincideix amb tots els segments que contenen la cadena "de", seguida de qualsevol sèrie de lletres, després un espai i finalment "Déu". Per tant, coincideix amb "de Déu" i "del nostre Déu". Una varietat d'aquests dispositius estan disponibles en paquets com Bible Word que admeten tota la classe de llenguatges de cadenes coneguts formalment com a -expressió regular- (Hopcroft i Ullman 1979).
Alguns llenguatges de patrons permeten a l'usuari restringir el material intermedi de diverses formes. GRAMCORD, per exemple, permet a l'usuari excloure qualsevol categoria gramatical específica d'intervenir entre patrons especificats, la qual cosa facilita que l'usuari es concentri en frases amb l'estructura desitjada.
Hem estat usant patrons de caràcters per a il·lustrar la cerca. Amb un programa de cerca com LBase que raona amb entitats de nivell superior com a morfemes, paraules i oracions, un pot trobar patrons fixos, combinacions booleanes i possibilitats de comodins en #aqueix nivells també. Patrons particularment poderosos són possibles en un llenguatge que li permet a un preguntar (per exemple) per tots els verbs que ocorren dins de tres paraules de la frase -en Crist-, sense verbs que intervinguin. Una alta proporció dels objectius que coincideixen amb aquest patró seran clàusules en les quals la frase preposicional de fet modifica el verb.
Tots els patrons que hem discutit fins a aquest punt coincideixen només sobre la base de la col·locació de paraules en el text, no sobre la base de les seves relacions gramaticals entre si. Un veritable comparador de patrons sintàctics pot recuperar clàusules basades en paraules que es troben en relacions específiques de modificació o dependència entre si. Aquesta capacitat requereix un programa de cerca que pugui diagramar eficaçment les oracions en el text o una base de text que estigui codificada per a dependències gramaticals. Tots dos enfocaments són tècnicament factibles, però cap dels dos s'utilitza en els sistemes disponibles popularment.
D. Analizar dades
En el nostre model de quatre fases d'activitat acadèmica, l'anàlisi de dades és la tercera fase, comparant les dades recopilades en la segona fase amb les hipòtesis formulades en la primera fase. Des d'una perspectiva, l'anàlisi és l'activitat que confirma o refuta una hipòtesi. Des d'una altra perspectiva, el problema no és la confirmació sinó l'exploració. Les desviacions entre hipòtesis i observació són el producte més important de l'etapa d'anàlisi i alimenten la formulació de noves hipòtesis per al pròxim cicle de recerca. En aquesta segona visió, una hipòtesi resumeix econòmicament les regularitats en un conjunt de dades i centra l'atenció en les irregularitats restants.
L'anàlisi pot ser qualitatiu (s'ocupa de categories, temes i una altra informació simbòlica no numèrica) o quantitatiu (se centra en els números extrets del text). La computadora ofereix eines per a ajudar amb tots dos.
1. Anàlisi qualitativa. Dues eines informàtiques comunes per a l'anàlisi qualitativa són la concordança i el sistema de gestió de la base de dades, o DBMS.
un. Concordances. Una concordança és una llista d'extractes d'un text, ordenats segons alguna característica lingüística de cadascun. En general, la característica és l'aparició d'una paraula, i la concordança ens permet veure en un sol lloc totes les aparicions de #aqueix paraula, juntament amb algun context per a cadascuna. Ja hem al·ludit a l'ús d'una concordança com a índex per a ajudar en la recopilació de dades. Una concordança també presenta dades en una forma que és convenient per a molts tipus d'anàlisis. Biblical Research Associates publica una àmplia varietat de concordances generades per computadora en la sèrie Computer Bible.
Les concordances van ser una eina important per als erudits durant anys abans de l'arribada de la computadora, però la preparació d'una concordança per a un text de la grandària de la Bíblia requeria tota una vida. Ara les computadores recopilen les dades per a les concordances molt més ràpidament i en diversos formats adaptats a problemes exegètics específics. El popular format Key-Word-In-Context o KWIC alinea les aparicions de la paraula de destí en el centre de la pàgina (el "marge"). Dins de l'article per a una sola paraula, les entrades es poden ordenar per context anterior o següent, la qual cosa permet a l'usuari notar diferències en les construccions que involucren la paraula. L'Annex 3 ( Fig. COM.03) mostra una porció d'una concordança KWIC en la partícula Gk ei,"Si", d'1 Corintis, de Morton, Michaelson i Thompson 1979. Pel fet que el context (en aquest cas, el context següent) està ordenat, l'entrada reuneix per a un estudi convenient frases com ei de, ei de tis i ei de christos.
Les concordances inverses classifiquen les paraules no pels seus començaments sinó per les seves finals i són útils per a identificar fragments de manuscrits que preserven el final d'una paraula. A partir d'un text completament analitzat, es poden preparar concordances que organitzin paraules per part del discurs o conjugació i declinació, així com per lema o forma textual. A mesura que els textos en línia es tornin més disponibles i l'augment de la potència de càlcul es torni menys costós, la noció d'una concordança impresa donarà pas a pantalles similars a les concordances preparades segons es necessitin.
B. Sistema d'administració de base de dades. Una concordança organitza un conjunt de contextos sobre la base d'una única característica. Un DBMS permet a l'usuari explorar la interacció de diverses funcions alhora. En la seva forma més simple, un DBMS emmagatzema informació en forma de registres, cadascun dels quals conté un nombre fix de camps. És una versió automatitzada de la venerable caixa de fitxes. Per exemple, una base de dades que recolzi l'estudi lèxic d'un substantiu en particular podria dedicar un registre a cada construcció sintàctica en la qual apareix el substantiu. Un camp de cada registre pot registrar la referència bíblica, un altre el tipus de construcció en la qual apareix el substantiu, un tercer la paraula en la construcció a la qual està lligat el substantiu, un quart el tipus de literatura en la qual ocorre el passatge, i un cinquè una breu definició apropiada per al substantiu en aquest context.
Definir els camps per a aquesta base de dades equival a construir una hipòtesi sobre els tipus d'informació que resultaran rellevants per a determinar el significat d'una paraula en un context donat. Una vegada que es registren les diverses construccions, el DBMS permet a l'usuari classificar-les i recuperar-les sobre la base de qualsevol camp o combinació de camps per a explorar correlacions entre camps. En general, el resultat del primer dia dedicat a examinar una base de dades d'aquest tipus és una redefinició dels camps, la qual cosa reflecteix un refinament de la hipòtesi original i, sovint, requereix tornar a la fase de recopilació de dades per a completar les noves categories. L'ús d'un DBMS permet la repetició d'aquest procés amb major freqüència i facilitat del que és possible amb les fitxes físiques.
2. Anàlisi quantitativa. L'anàlisi quantitativa ha guanyat popularitat entre els humanistes amb l'arribada de la computadora i el desenvolupament de paquets de programari estadístic. Per a moltes persones, "estudis bíblics assistits per computadora" és gairebé sinònim d'esforços per a avaluar l'autoria de llibres bíblics a partir de característiques estilístiques, com a vocabulari, riquesa de vocabulari, usos gramaticals i modismes (Morton 1978; Radday i Shore 1985). .
L'estadística moderna ofereix dues classes d'eines: anàlisi de dades confirmatòries i anàlisis de dades exploratòries. Si bé l'anàlisi confirmatòria ha atret molta atenció, sovint s'aplica incorrectament. L'anàlisi de dades exploratòries ofereix un enorme potencial sense explotar per als estudis bíblics.
un. Anàlisi de dades confirmatòries. L'anàlisi de dades confirmatòries (CDA) és una encarnació matemàtica del costat de l'anàlisi que busca confirmar o refutar una hipòtesi. La hipòtesi defineix una població, de la qual les dades pretenen extreure's. CDA avalua aquesta afirmació en estimar la probabilitat que les dades provinguin de #aqueix població.
Per exemple, en estudis típics d'autoria, l'analista deriva les característiques de l'estil d'un autor a partir d'una mostra de text que se sap que prové de #aqueix autor. S'espera que les característiques triades romanguin bastant constants en totes les obres de l'autor, però variïn d'un autor a un altre. Ningú espera que un autor produeixi exactament el mateix valor per a tals característiques en cada text, però la variació entre els textos coneguts es pot mesurar i usar per a estimar fins a quin punt l'autor podria desviar-se dels valors mitjans. L'analista mesura les característiques corresponents d'un text d'autoria desconeguda i calcula la probabilitat que una població de textos que exhibeixen els valors i rang de variació mostrats pels textos coneguts també pugui incloure textos amb els valors mostrats pels textos desconeguts.
CDA també és un conjunt útil d'eines per a abordar qüestions gramaticals i estructurals. Per exemple, la paraula "esperit" apareix 26 vegades en Romans, 18 d'elles en el cap. 8. Podria tal concentració de vocabulari resultar d'una distribució aleatòria de paraules sobre el text, o reflecteix l'estructura temàtica del llibre? CDA proporciona mitjans quantitatius per a avaluar la importància de tals concentracions.
Els estudis que apliquen CDA han d'afrontar diversos desafiaments. Els discutirem en termes d'estudis d'autoria, però existeixen qualificacions similars per a qualsevol aplicació d'aquests mètodes. Per a referències i discussió addicional, vegi Andersen (1976). Un model d'anàlisi és Mosteller i Wallace (1964).
La mostra utilitzada per a definir la població ha de ser de l'autor en qüestió. Si no tenim textos que se sàpiga que siguin d'un autor, difícilment podrem establir paràmetres per a qualificar textos desconeguts.
Si les diferències entre les mostres conegudes i desconegudes han d'atribuir-se a diferents autors, les mostres no han de diferir d'altres formes (com a gènere literari, tema, període de la vida de l'autor, activitat editorial posterior o registre lingüístic). Si les mostres difereixen de diverses formes simultàniament, resulta molt difícil determinar quina de les diferències és responsable dels diferents valors de les característiques que mesura l'estadístic. Els estudis literaris a vegades busquen eludir aquest problema enfocant-se en paraules funcionals (com a preposicions, conjuncions, pronoms relatius i la còpula) en lloc de paraules de contingut (com a substantius, verbs i adjectius) assumint que l'ús d'un autor mostrarà més consistència. en paraules funcionals que en paraules de contingut. Aquesta distinció pot ser una certa per al tema, però no aborda les diferències de gènere o registre. Per exemple, és ben sabut que algunes partícules ocorren amb molta menys freqüència en la poesia hebrea que en la prosa, independentment de l'autoria.
En els estudis estadístics en general, més dades són millors que menys. La precisió dels resultats sovint tendeix a augmentar com l'arrel quadrada del nombre d'observacions. Per a obtenir una resposta el doble de precisa, es necessiten quatre vegades més dades. Els estudis d'autoria històrica en la literatura no bíblica solen utilitzar de l'ordre de 100.000 paraules de text, molt més allà de la quantitat de dades disponibles per als estudis d'autoria bíblica.
Si s'aplica correctament, la CDA és una eina indispensable, però la promesa d'un veredicte de "veritable-fals" que es manté és seductora. És fàcil passar per alt els extensos esculls metodològics i assumir que, si un procediment llança un número, la resposta és segura. L'aplicació responsable d'aquestes tècniques requereix una col·laboració estreta i estesa entre exegetes que entenen quines preguntes són significatives en termes del text i estadístics amb una base sòlida en les capacitats i limitacions de les seves eines. Les introduccions accessibles a CDA inclouen Mosteller, Rourke i Thomas (1961) i Mosteller i Rourke (1973).
B. Anàlisi exploratòria de dades. Els últims anys han vist una explosió d'interès estadístic en l'anàlisi de dades exploratòries (EDA). On CDA personifica la visió d'una hipòtesi com una afirmació per a ser provada o refutada, EDA implementa la visió que una hipòtesi és una explicació parcial de les dades, els efectes de les quals han d'entendre's i eliminar-se perquè es puguin veure patrons addicionals. EDA no emet un veredicte sobre hipòtesi, però li dóna a un l'equivalent matemàtic d'una lupa, aclarint les dades com a entrada a la discreció acadèmica. Les seves tècniques poden revelar l'estructura i l'ordre que d'una altra manera romandrien ocults en les dades. La pedra angular d'EDA és Tukey (1977), juntament amb Mosteller i Tukey (1977).
Aquestes tècniques s'han utilitzat, per exemple, per a explorar la distribució dels verbs fronterers entre les tribus en Josué 14-19. Començant amb una taula que indica quantes vegades cada llista de límits tribals usa cadascun dels verbs, les tècniques EDA de poliment mitjà i recodificació suggereixen una forta preferència per cinc dels verbs en els límits de Benjamí, Judà, Efraín i Manasés, mentre que quatre altres verbs dominen els límits de Zabulón, Isacar, Aser i Neftalí. Aquesta observació, que seria difícil de realitzar sense aquestes tècniques, pot correlacionar-se de diverses formes amb el context de l'assignació de la terra.
Les tècniques de Tukey (1977) es poden aplicar amb paper i llapis, encara que les implementacions per computadora són cada vegada més comunes. Altres tècniques d'EDA impliquen càlculs massius que requereixen assistència informàtica. Entre aquests es troben l'anàlisi de conglomerats i l'escala multidimensional (Parunak 1989a). Totes dues tècniques brinden maneres de visualitzar les diferències entre una sèrie d'elements (per exemple, paraules de vocabulari o manuscrits). Comencen amb una estimació de similitud per a cada parell d'elements. L'anàlisi de conglomerats explora què tan bé es poden explicar aquestes similituds com resultat d'un conjunt de categories diferents i cerca recuperar les categories subjacents. L'escalat multidimensional (MDS) busca construir un model geomètric del conjunt de similituds, permetent així a l'estudiós veure una disposició espacial dels elements que correspon a les similituds subjacents. L'Annex 2 (Fig. COM.02) és un exemple dels resultats de MDS.
Un principi central d'EDA és que una imatge val mil dígits. Les taules de números són difícils d'entendre fins i tot si un sap el que està buscant, però una gràfica o diagrama apropiat pot portar a l'observador a hipòtesis imprevistes. Les computadores poden generar gràfics fàcilment i, per tant, aprofitar la informació que pot brindar una imatge.
Per exemple, Linguistic Density Plots (Parunak 1981a) mostren la distribució d'un fenomen lingüístic (com una paraula específica o una construcció gramatical) al llarg d'un text, amb ubicació en el text en l'eix horitzontal i concentració en l'eix vertical. El resultat és una sèrie de pics que mostren en quina part del text es concentra el fenomen. Tal trama li dóna a l'acadèmic una "sensació" de concentracions que és gairebé impossible d'aconseguir amb una llista de concordances solament. Ofereix pistes sobre l'estructura literària que serien difícils de trobar sense ella.
Els quadres 4-6 mostren tres diagrames de densitat de l'epístola de Pablo als Romans. Cada vinyeta fosca en la trama representa una ocurrència separada de la paraula que es traça. Apareix un nombre enter en lloc d'una vinyeta si dues o més ocurrències estan una damunt de l'altra. L'eix horitzontal o "REFERÈNCIA" mostra la ubicació en el llibre, amb els començaments dels capítols etiquetats i cada posició horitzontal representa quatre versicles. L'eix vertical o "DENSITAT" es calcula de tal manera que com més alt es traça un punt, més a prop està de les ocurrències adjacents del mateix fenomen.
L'Annex 4 ( Fig. COM.04) mostra una concentració dramàtica de paraules que comencen amb Israel (com -Israel- i -Israelita-) en els capítols. 9-11. Aquesta distribució no sorprèn a ningú familiaritzat amb l'estructura general dels romans. No obstant això, l'Annex 5 ( Fig. COM.05) del verb sozo, "salvar", i les paraules que comencen amb soter (com a "salvador" i "salvació"), és fascinant. Mostra que també aquestes paraules, que molts sospitarien que són característiques de tota l'epístola, estan concentrades en capítols. 9-11, i suggereix que la restauració d'Israel contemplada en aquests capítols no és només una ocurrència tardana de la preocupació del llibre per la salvació, sinó un element integral en la discussió. Annex 6 (Fig. COM.06) mostra que els substantius i verbs que descriuen -misericòrdia- també predominen en aquests tres capítols, aquesta vegada en concentracions que formen una inclusio al principi i al final de la secció.
No totes les parcel·les són iguals. Alguns paquets de gràfics per computadora creen gràfics cridaners que de fet enfosqueixen en lloc d'aclarir les dades, i alguns tipus de pantalles són millors que uns altres per a mostrar tipus específics de dades. L'omnipresent gràfic circular, per exemple, comunica la preponderància d'una categoria sobre una altra, però les proves han demostrat que els espectadors no poden extreure informació quantitativa d'ell de la forma més de confiança possible d'un gràfic de barres o un gràfic de línies. Com un altre exemple, un canvi en els eixos d'un gràfic lineal o diagrama de dispersió (diguem, de lineal a logarítmic o quadrat) pot canviar dràsticament les intuïcions suggerides per les dades. Tufte (1983) i Cleveland (1985) són excel·lents guies per a la presentació gràfica de dades.
E. Presentar resultats
L'erudició bíblica implica una conversa contínua entre els estudiants passats, presents i futurs del text. La computadora ofereix noves eines per a ajudar i moderar aquesta conversa, tant fent un ús més efectiu dels mitjans impresos tradicionals com com a mitjà de comunicació per dret propi.
1. Mitjans impresos. La primera introducció que molts humanistes tenen a les computadores és com a processadors de text. Per més mundana que sembli aquesta aplicació, ha portat a un augment dramàtic en la facilitat i velocitat de moure idees d'una ment a una altra. Les correccions i modificacions són molt més senzilles de fer que abans, i molts editors poden treballar directament a partir del text llegible per màquina d'un autor, evitant així el canvi de clau d'un manuscrit per a la composició tipogràfica, que consumeix molt temps i és propens a errors.
Hem parlat de les concordances i les trames com a eines d'anàlisis. La facilitat amb la qual es poden adaptar per a un propòsit específic també els fa atractius com a ajudes per a comunicar al lector l'evidència que recolza els arguments d'un autor, al mateix temps que imposa una responsabilitat addicional a l'autor per a assegurar-se que siguin clars i no enganyosos.
2. La computadora com a mitjà. A més de produir material per a la distribució impresa, les computadores poden ser per si mateixes el mitjà d'activitat acadèmica. Potser el primer exemple d'aquesta tendència és la instrucció assistida per computadora. Per a exercicis bàsics de vocabulari i paradigmes en l'estudi d'idiomes, les computadores ofereixen una versió flexible de la venerable targeta flaix. Les tecnologies més recents que estan transformant la computadora en un mitjà de conversa acadèmica inclouen xarxes i hipermedia.
un. Xarxes. La creació de xarxes, la vinculació de les computadores perquè puguin intercanviar informació, ja és un mitjà important d'interacció acadèmica diària en les ciències. El correu electrònic (correu electrònic) passa per alt la capçalera, les secretàries, les estampilles, els sobres i els carters, i transporta missatges directament des de la computadora d'un acadèmic a la d'un altre, amb servei el mateix dia fins i tot a l'altre costat de l'oceà. El correu electrònic és més ràpid i de confiança que el correu convencional i (a diferència de la conversa telefònica) no requereix que totes dues parts siguin lliures al mateix temps.
La conferència per computadora o el tauler d'anuncis és l'equivalent informàtic d'una discussió. En la seva forma més simple, consisteix en una sèrie de comentaris dels participants sobre un tema d'interès. Els participants posteriors poden llegir els comentaris dels participants anteriors i oferir les seves respostes i observacions. La creació de xarxes permet que persones que estan molt separades geogràficament participin en la discussió. Els participants no solen participar al mateix temps. Igual que amb el correu electrònic, la conferència per computadora manté un registre de la discussió perquè en qualsevol moment els participants puguin revisar els comentaris i agregar els seus.
A mesura que més acadèmics preparen la seva recerca en forma electrònica, es torna cada vegada més factible per als editors donar suport a les presentacions mitjançant la creació de xarxes. En l'àmbit de les ciències, s'estan realitzant activament recerques per a permetre que tot el procés d'enviament, revisió i correcció es realitzi per correu electrònic, sense necessitat de circular en paper. El següent pas és la revista electrònica, distribuïda als lectors finals per la xarxa en lloc d'en paper.
B. Hipermedia. Hipermedia és el terme genèric per a una col·lecció d'elements d'informació vinculats entre si de manera que un usuari pot passar d'un element a qualsevol dels diversos associats amb ell, segons la necessitat i l'interès. Si els elements d'informació es limiten al text, es parla d'hipertext "". Una enciclopèdia és un exemple simple d'hipertext, amb els articles que constitueixen els elements d'informació i el moviment d'un element a un altre guiat per referències creuades incrustades en els articles. La característica fonamental d'un repositori d'informació estructurat com hipermedia és que ajuda a l'usuari a moure's en moltes seqüències diferents, en lloc d'en un ordre lineal fix, com és habitual en llibres i articles de revistes.
Annex 7 (veure Fig. COM.07) il·lustra SymEdit, una aplicació de la tecnologia d'hipertext. La literatura bíblica fa un ús extensiu de repeticions simètriques de paraules, construccions gramaticals i idees per a definir els tipus d'estructura que les marques de paràgraf i els títols dels capítols proporcionen en la literatura moderna (Parunak 1981b). Per a descobrir i analitzar tals estructures, els acadèmics comunament fotocopien el passatge, el tallen en trossos amb tisores i tracten d'organitzar les peces per a acostar seccions similars entre si per a comparar-les. Si bé les pantalles resultants són extremadament útils, les manipulacions mecàniques necessàries per a produir-les són tedioses i maldestres. SymEdit permet a un analista organitzar un text en columnes (corresponents a passatges paral·lels) i files (que contenen característiques repetides). Les files es poden etiquetar per a identificar les característiques que aïllen. Les files i columnes individuals es poden contreure o expandir per a acostar altres materials i comparar-los. L'exhibició mostra el començament de quatre panells en Deuteronomi 12, cadascun dels quals segueix la mateixa estructura en legislar el culte en un santuari central. En expandir l'estructura unidimensional del text imprès en dues dimensions, SymEdit ajuda a l'acadèmic a identificar i analitzar estructures repetitives. SymEdit també és útil per a realitzar comparacions crítiques i per a estudiar relats narratius paral·lels. SymEdit ajuda a l'acadèmic a identificar i analitzar estructures repetitives. SymEdit també és útil per a realitzar comparacions crítiques i per a estudiar relats narratius paral·lels. SymEdit ajuda a l'acadèmic a identificar i analitzar estructures repetitives. SymEdit també és útil per a realitzar comparacions crítiques i per a estudiar relats narratius paral·lels.
Si bé l'hipertext existeix des de fa anys en forma d'enciclopèdies, la tecnologia informàtica ho fa més compacte, més fàcil d'usar i més versàtil. El volum d'informació contingut en una enciclopèdia completa de 20 volums es pot emmagatzemar en forma electrònica en un disc òptic de menys de sis polzades de diàmetre i un vuitè de polzada de gruix. Un sistema d'hipertext informatitzat pot saltar ràpidament d'un element a un altre en aquest disc amb el toc d'una tecla, sense la necessitat que l'usuari passi les pàgines o canviï els volums. Pel fet que el disc pot emmagatzemar imatges gràfiques i de so, així com text, aquest sistema pot proporcionar hipermedia complet.
Per exemple, el sistema de CD-Word actualment en desenvolupament en el Seminari Teològic de Dallas permetrà que un usuari que estigui llegint un text bíblic en forma electrònica invoqui diverses traduccions d'un versicle, per a saltar a una entrada de lèxic per a qualsevol paraula en el text, o per a accedir a comentaris, gramàtiques i enciclopèdies seleccionats sobre un passatge en consideració. L'objectiu és proporcionar en un sol sistema informàtic un entorn comparable al qual proporcionen una prestatgeria de llibres i un escriptori en l'estudi convencional. El sistema CELLAR, un disseny de l'Institut Lingüístic d'Estiu, permetrà a un lingüista ordenar notes de camp, organitzar estudis lèxics i comparar múltiples traduccions mentre prepara una nova versió d'un text bíblic. Alguns dissenys permeten als usuaris agregar les seves anotacions personals a la xarxa d'informació,
Al principi, tals sistemes seran biblioteques electròniques independents, però la visió última dels hipermedia (Nelson 1987) combina la noció d'unitats d'informació vinculades amb xarxes de computadores per a anticipar un món en el qual el recurs global del coneixement humà sigui accessible des de qualsevol computadora. .
Bibliografia
Alter, R. 1985. L'art de la poesia bíblica. Nova York.
Andersen, FI 1976. Estil i autoria. El document de Tyndale 21: 2.
Baird, JA i Freedman, DN, eds. 1971-. La Bíblia de la Computadora. Wooster, OH.
Beekman, J. i Callow, J. 1974. Traduint la Paraula de Déu. Grans ràpids.
Brachman, RJ i Levesque, HJ 1985. Readings in Knowledge Representation. Pal Alt.
Cleveland, W 1985. Els elements de la representació gràfica de dades. Monterey.
Collins, T. 1978. Line-Forms in Hebrew Poetry. Studia Pohl: Sèrie Maior 7. Roma.
Cook, WA 1979. Gramàtica de casos: desenvolupament del model matricial (1970-1978). Washington.
Fillmore, CJ 1968. The Casi for Casi. En Universals in Linguistic Theory, ed. E. Bach i R. Harms. Englewood Cliffs, Nova Jersey.
Friberg, T. i Friberg, B. 1981. Una anàlisi assistida per computadora del text grec del Nou Testament. En Patton i Holoien 1981.
Geller, SA 1979. Paral·lelisme en la poesia bíblica primerenca. HSM 20. Missoula.
Grimes, JE 1975. The Thread of Discourse. N'hi hagi.
Hoquei, SM 1980. Una guia d'aplicacions informàtiques en les humanitats. Baltimore.
Hopcroft, JE i Ullman, JD 1979. Introducció a la teoria, els llenguatges i la computació dels autòmats. Reading, PA.
Hughes, JJ 1987. Bits, Bytes i Biblical Studies. Grans ràpids.
Longacre, RE 1976. Anatomia de les nocions de la parla. Lisse, Holanda.
Mann, WC i Thompson, SA 1987. Teoria de l'estructura retòrica: una teoria de l'organització del text. En L'estructura del discurs, ed. L. Polanyi. Norwood, Nova Jersey.
Miller, PA 1984. Manual de referència de GRAMCORD. Deerfield, EL MEU.
Morris, PMK i James, E. 1975. Un llibre de paraules crítiques de Levític, Números, Deuteronomi. Bíblia de computadora 8. Wooster, OH.
Morton, AQ 1978. Detecció literària: com demostrar autoria i frau en literatura i documents. Nova York.
Morton, AQ; Michaelson, S .; i Thompson, JD 1979. Una concordança crítica amb I i II Corinthians. Bíblia de computadora 19. Wooster, OH.
Mosteller, F. i Rourke, REK 1973. Sturdy Statistics. Reading, PA.
Mosteller, F .; Rourke, REK; i Thomas, GB, Jr. 1961. Probabilitat i estadística. Reading, PA.
Mosteller, F. i Tukey, JW 1977. Anàlisi i regressió de dades. Reading, PA.
Mosteller, F. i Wallace, DL 1964. Inferència i autoria en disputa. Reading, PA.
Nelson, T. 1987. Literary Machines. Sant Antoni.
O’Connor, M. 1980. Estructura del vers hebreu. Winona Lake, IN.
Parunak, HVD 1979. Structural Studies in Ezekiel. Doctor. Diss. , O. de Michigan.
—. 1981a. Tipografia oral: alguns usos de l'estructura bíblica. Bib 62: 2, 153-68.
—. 1981b. Prolegòmens a les concordances pictòriques. Les computadores i les humanitats 15: 15-36.
—. 1983. Tècniques de transició en la Bíblia. JBL 102: 525-48.
—. 1989a. Interrogant una llengua morta. En Parunak 1989b.
Parunak, HVD, ed. 1989b. Eines informàtiques per a textos antics. Winona Lake, IN.
Patton, PC i Holoien, RA 1981. Computació en Humanitats. Lexington, KY.
Radday, YT 1973a. Una concordança crítica d'Hageo, Zacarías, Malaquías. Bíblia de computadora 4. Wooster, OH.
—. 1973b. La unitat d'Isaïes a la llum de la lingüística estadística. Hildesheim.
Radday, YT i Shore, H. 1985. Gènesi: un estudi d'autoria. Roma.
Tufte, ER 1983. La presentació visual d'informació quantitativa. Cheshire.
Tukey, JW 1977. Anàlisi de dades exploratòries. Reading, PA.
H. VAN DYKE PARUNAK
[29]
Definició adaptada i traduïda al català d'un diccionari bíblic de domini públic (Diccionari modern de la Bíblia).