¿Qué estás haciendo?
Enviado por pvaldes el 28 Febrero, 2013 - 00:46.
El programa para hacer eso es perl, precisamente por el grado de desarrollo de las expresiones regulares, en terminal sería un one-liner, por ejemplo para extraer "Friends 1075" sería algo como
perl -e 'while (<>){if (/ class="text"(.*?)><\/span>.*? class="count">(.*?)</){print $1, $2}};' pagina_web.xmlla otra opción es un grep con expresiones regulares, pero las expresiones regulares no son siempre la mejor idea, por ejemplo
¿que pasa si tu descarga fuera así?
<span class="text">Friends<
/span><span class="count">1075</
span> ..... diez capítulos más tarde aparece un tag de cierre entero... </span>o así
<span class="text">Friends</span><span class="count">1075</span>Lo ideal es irte a un procesador de xml, y eso implica usar un módulo adecuado de perl, python o lo que prefieras, para evitar los saltos de línea aleatorios al acabar la línea, y otros problemas que se pueden presentar
Enviado por ratakruel el 28 Febrero, 2013 - 00:53.
Estimado Sidd:
a ver... a ver... si tienes el archivo, lo puedes "medir" ...
algo como
cat loquesea.html|wc -l
para saber cuantas lineas tiene el archivo, luego puedes saber qué número de línea es la primera que necesitas
cat loquesea.html|nl -w1 -s:|grep 'patrón regular'|cut -d: -f1
luego necesitas hacer lo mismo para la última línea a rescatar y finalmente:
cat loquesea.html| tail -$desde| head -$hasta
ideas... ideas... ¿ se entiende ?
Enviado por ratakruel el 28 Febrero, 2013 - 00:54.
@Sidd
esto con bash, yo que tu le haría caso a pvaldes. Es más fácil usando perl.
Enviado por siddharta el 28 Febrero, 2013 - 01:41.
[...] las expresiones regulares no son siempre la mejor idea, por ejemplo ¿que pasa si tu descarga fuera así?[...] evitar los saltos de línea aleatorios al acabar la línea, y otros problemas que se pueden presentar
Tienes razón, no había pensado en ello, pues he supuesto que la página siempre se presentaría de la misma forma, pero en realidad ya sabemos que al ser contenido dinámico y código preprocesado queda claro que no siempre tendrá la misma presentación interna.
Muchas gracias, no sé nada de Perl pero veré qué puedo hacer con el código. No es algo de lo cual tenga urgencia, es sólo que se me ocurrió hacer un script que cada día lea mi página de amigos en facebook y me avise del número de amigos.
Sidd.
Enviado por siddharta el 28 Febrero, 2013 - 01:43.
@Sidd
esto con bash, yo que tu le haría caso a pvaldes. Es más fácil usando perl.
Jejeje, sí, precisamente pensaba hacerlo con Bash, usando los comandos que conozco, o alguno nuevo por conocer. Veré si puedo hacerlo con bash con los ejemplos que me has dado, y también con perl con lo que indicó pvaldes, aunque ya dije que de perl sé absolutamente nada.
nastardes
:)
Enviado por alambre el 28 Febrero, 2013 - 02:35.
siddharta
si vas a hacerlo en bash y si tiene bien definidas las clases con sed es bastante fácil también, pero para obtener muchos patrones distintos en un barrido quizá se pueda complicar mucho.
si es en dos lineas se puede con / /,/ /
/ desde la linea que contiene / , / hasta la linea que contiene / y borre el resto
sed -e '/"text">/,/<\/span>/!d'
sed -e '/"text">/,/<\/span>/!d' | sed -e '2q;d' (le tengo que pedir la segunda linea porque me da 3)
sed -e '/"count">/,/<\/span>/!d' | sed -e '2q;d'
sed -e '/.*">/,/<\/span>/!d; /span/d' o en un paso pero mas parecido para todos (si se define una regex que los abarque)si esta en una linea es mas fácil (lo normal de cuando se genera el código html), me ahorro tener que pedirle la segunda linea
si es <span class="text"> Friends </span> en una linea
le pido .* cualquier cosa de mas de un carácter que quede entre los paréntesis,
sed -r -e 's/.*"text">(.*)<\/span>/\1/'
o para todos
sed -r -e 's/<span.*">(.*)<\/span>/\1/' se puede completar mejorPD etiquetas,
Enviado por Black Rider el 28 Febrero, 2013 - 23:22.
¡Me acaba de llegar el último Knoppix con mi Linux Magazine!
Enviado por siddharta el 28 Febrero, 2013 - 23:37.
siddharta si vas a hacerlo en bash y si tiene bien definidas las clases con sed es bastante fácil también [,,,]
Uy, me quedé bizco con tanta coma y barra, jejeje. Muchas gracias, veré qué puedo hacer con las sugerencias de todos ustedes sobre el uso de sed/perl/grep/
Sidd.
Enviado por yen-lo-wan el 1 Marzo, 2013 - 00:59.
Pues no se donde me equivoque en mi aprendizaje de Linux y su entorno, pero entiendo mucho mas el código C que todas estas parrafadas de bash...
Enviado por siddharta el 1 Marzo, 2013 - 01:46.
Hablando de programación:
Lightbot
http://www.flashninjaclan.com/games2/lightbot/lightbot.swf (Guardar como ...)
El robot debe pararse sobre cada cuadro azul y presionarlo para encenderlo. Se programa el robot mediante las instrucciones: avanzar, girar a la izquierda/derecha, saltar hacia adelante, encender. Si se necesitan repetir pasos entonces dichas instrucciones se pueden arrastrar a las áreas de funciones 1 y 2, y posteriormente invocar dichas funciones en el método normal.
Saludos,
Sidd.







Enviado por Black Rider el 16 Junio, 2013 - 12:37.
Yo es que los métodos "cadenita" no los veo resistiendo una multiherramienta decente. Una señora cadena, vale. Sacar una del bolsillo y liquidar la cadena (o a lo que esté enganchado, porque es muy triste a qué cosas enganchan las cadenas) no lleva cinco segundos.
Por supuesto, siempre saltará alguno diciendo: ¿Pero quién lleva una de esas en el bolsillo?" Es una variante de "¿Pero quién sería capaz de hackear mis comunicaciones de ese modo, que justifica el despliegue de seguridad que tu propones?". Pues la respuesta a ambas preguntas es:
YO
Y si hay un tronado como YO por ahí equipado con chatarra para hacer cabronadas en redes domésticas y cortar cadenas a lo vivo, no puedes asumir que no hay más.
Enviado por Debish el 16 Junio, 2013 - 12:22.
Imaginaba que iría por ahí, pero esperaba que fuera otra cosa
Lo de dejar el portátil sólo, con una pequeña cadenita e irme, como que no lo veo muy realista
Pues en realidad se utiliza mucho. Donde yo trabajo, por ejemplo, somos un montón de gente y más o menos todos nos conocemos, pero el edificio es muy grande y el acceso a las diferentes plantas, laboratorios y despachos no está restringido. La "cadenita" te sirve para dificultar que te roben el portátil lo suficiente como para que un compañero vea que están intentando forzar el cierre de seguridad o algo por el estilo. Siempre hay gente de confianza alrededor, y mientras que probablemente no parezca tan raro que alguien coja tu portátil (si lo hace con naturalidad, quien sabe si tiene el permiso del dueño; puede ser amigo/compañero de otra planta, un colaborador recién llegado, etc), lo que sí se sale de ojo es que alguien intente forzar el candado. Yo, en este ámbito, lo veo bastante útil, a pesar de que pueda parecer una medida endeble (que en términos absolutos, lo es). Desde luego, hay que entenderlo como una forma de proteger el portátil durante periodos de tiempo breves (a lo mejor mientras vas al bench a cambiar algún reactivo, centrifugar o algo así), no como una medida que te permita dejarlo a la interperie todo el día.
Enviado por Black Rider el 16 Junio, 2013 - 09:50.
Menudo truño de medida de seguridad, sinceramente.
Incluso aunque no te lo puedan sustraer (que es mucho decir, porque a lo mejor resulta que te aparecen con una multiherramienta en el bolsillo y te revientan la cadena), si dejo un ordenador sólo, me arriesgo a cualquier tipo de destrozo:
Por ejemplo, que agarren el ordenador y lo llenen de pegatinas anarco-comunistas.
Por ejemplo, que le peguen un mazazo.
Por ejemplo, que le calcen algún tipo de malware de la muerte.
No tengo por costumbre dejar mis cosas abandonadas por ahí, sean ordenadores o no. La gente se suele reír cuando ven que para moverme al despacho de al lado, lo recojo todo y lo muevo de un lado a otro. Se suele reír, hasta que a la hora de volver descubrimos que al pánfilo que dejó las cosas desatendidas le han robado la chaqueta con la cartera dentro. O le han escrito con rotulador "Mar1cón de Mierd4", aunque tengo que decir que esa vez me reí bastante.
Enviado por cnicolas el 16 Junio, 2013 - 09:43.
Imaginaba que iría por ahí, pero esperaba que fuera otra cosa
Lo de dejar el portátil sólo, con una pequeña cadenita e irme, como que no lo veo muy realista
Es bastante útil si trabajas con portátil, así evitas moverlo a diario
Enviado por luisjhoca el 16 Junio, 2013 - 07:38.
Tratando de instalar debían en mi Toshiba satellite u960; ¿que arquitectura de debían debo descargar?
Enviado por rioport el 16 Junio, 2013 - 05:04.
Lo de dejar el portátil sólo, con una pequeña cadenita e irme, como que no lo veo muy realista
Enviado por pvaldes el 16 Junio, 2013 - 01:19.
Imaginaba que iría por ahí, pero esperaba que fuera otra cosa
Lo de dejar el portátil sólo, con una pequeña cadenita e irme, como que no lo veo muy realista
Enviado por Debish el 15 Junio, 2013 - 23:35.
mmmh... duda existencialista
acabo de fijarme en un HP pavillion de serie g, que tiene en el canto del lado derecho una ranura con un dibujo de un candado con una K dentro
suena tentador... ¿alguien sabe para qué vale esto?...
Es simplemente un orificio que sirve para ponerle una cadena de Laptop, (tipo cadena para bicicleta) y amarrarla al escritorio o lugar fijo y que nadie se la pueda robar "fácilmente".
Eso es, y lo tienen bastantes portátiles, no es exlclusivo de HP.
Enviado por tlacuacheoscuro el 15 Junio, 2013 - 22:44.
mmmh... duda existencialista
acabo de fijarme en un HP pavillion de serie g, que tiene en el canto del lado derecho una ranura con un dibujo de un candado con una K dentro
suena tentador... ¿alguien sabe para qué vale esto?...
Es simplemente un orificio que sirve para ponerle una cadena de Laptop, (tipo cadena para bicicleta) y amarrarla al escritorio o lugar fijo y que nadie se la pueda robar "fácilmente".
Enviado por pvaldes el 15 Junio, 2013 - 20:59.
mmmh... duda existencialista
acabo de fijarme en un HP pavillion de serie g, que tiene en el canto del lado derecho una ranura con un dibujo de un candado con una K dentro
suena tentador... ¿alguien sabe para qué vale esto?...
Enviado por cnicolas el 15 Junio, 2013 - 15:45.
hoyo en la tierra... te presento a plántula de tomate
pequeño tomate... éste es hoyo en la tierra
me da a mí que vais a ser inseparables amigos, brindemos con manguera para celebrarlo
Si luego le añades algo de abono para que pique junto con la celebracion, se harán inseparables
Enviado por pvaldes el 15 Junio, 2013 - 12:18.
hoyo en la tierra... te presento a plántula de tomate
pequeño tomate... éste es hoyo en la tierra
me da a mí que vais a ser inseparables amigos, brindemos con manguera para celebrarlo
Enviado por cnicolas el 15 Junio, 2013 - 12:09.
un moderador/a que borre http://www.esdebian.org/wiki/backtrack-5-tutorial-curso-espanol
motivo Nº1 no tiene nada que ver con debian
no es la primera vez que pone contenido inapropiado en la wiki
No, ya le he visto poner cntenido de este tipo y siempre en la wiki
Enviado por rockyiii el 14 Junio, 2013 - 23:57.
un moderador/a que borre http://www.esdebian.org/wiki/backtrack-5-tutorial-curso-espanol
motivo Nº1 no tiene nada que ver con debian
no es la primera vez que pone contenido inapropiado en la wiki
Enviado por kikollo el 14 Junio, 2013 - 18:40.
Si son necesarios. Aquí tienes otra dirección donde se entiende un poco mejor:
http://debian.barrapunto.com/article.pl?sid=13/06/14/0738216&from=rss
Enviado por caliban el 14 Junio, 2013 - 18:29.
buscando información sobre los repositorios multimedia.
¿es verdad que ya no son necesarios con debian 7?
Creo que te referis a esta noticia :
http://bits.debian.org/2013/06/remove-debian-multimedia.html
Pero el repositorio se encuentra en el dominio deb-multimedia.org
http://www.deb-multimedia.org/
Enviado por rique el 14 Junio, 2013 - 18:20.
buscando información sobre los repositorios multimedia.
¿es verdad que ya no son necesarios con debian 7?
Enviado por Black Rider el 14 Junio, 2013 - 13:06.
Qué-hago:
Escupo sobre este artículo mientras escucho House of Death a todo volumen.
http://www.landoverbaptist.net/showthread.php?t=85281
También re-ordeno mis manuales de juegos de rol a después de tragarme esto.
http://www.landoverbaptist.net/showthread.php?s=cef316277ad2a7effa2e99a3...
EDITO: Hay más.
http://www.chick.com/reading/tracts/0046/0046_01.asp
Parece que están empeñados en hacerle publicidad gratis a D&D
Enviado por ajen el 13 Junio, 2013 - 07:35.
buscando los 5 puntitos para poder abrir un tema y pedir ayudaaa!!!
Bueno, pues ya los tienes. Pero en lo sucesivo evita cosas como "solo se que no se nada
bueno, que estoy buscando los 5 puntitos para pedir ayudaaaa!!!! y escribo en post y no suben los puntos"
en hilos random. Porque llego yo y te lo borro.
Como los viejos tiempos
Enviado por shaola el 12 Junio, 2013 - 10:47.
buscando los 5 puntitos para poder abrir un tema y pedir ayudaaa!!!
Bueno, pues ya los tienes. Pero en lo sucesivo evita cosas como "solo se que no se nada
bueno, que estoy buscando los 5 puntitos para pedir ayudaaaa!!!! y escribo en post y no suben los puntos"
en hilos random. Porque llego yo y te lo borro.
juas, hace mucho que no afilas la guadaña
Enviado por arctica el 12 Junio, 2013 - 10:26.
buscando los 5 puntitos para poder abrir un tema y pedir ayudaaa!!!
Bueno, pues ya los tienes. Pero en lo sucesivo evita cosas como "solo se que no se nada
bueno, que estoy buscando los 5 puntitos para pedir ayudaaaa!!!! y escribo en post y no suben los puntos"
en hilos random. Porque llego yo y te lo borro.
Enviado por cnicolas el 12 Junio, 2013 - 10:20.
Echandole un ojo a lua, inquieto que es uno...
Enviado por alnus el 11 Junio, 2013 - 18:39.
@suku
Gracias.
Ya lo conocía.
Normalmente uso winwrangler, pero no sé por qué esta vez se empeñaba en no ejecutarse al mismo tiempo que fbpanel. Así que probé pytyle, y la verdad es que para lo que yo uso el "tiling" me va bien.
Pytyle no viene en los repositorios, me tuve que buscar un .deb en Google, y lo instalé con dpkg. Al ejecutarlo es cuando dice que no está tal o cual librería, pero esas sí que las encontré en los repositorios.
Saludos.
Enviado por Black Rider el 11 Junio, 2013 - 16:19.
Es que a los enanos los quieres para matar a los trolls, se entiende. Si las enanas son marimachos, pues peor para los trolls.
Enviado por pvaldes el 11 Junio, 2013 - 14:38.
Hum, pero... las mujeres enano tienen barba... mientras que las palabras Cate blanchett y pelusilla bigotera no pueden estar juntas en la misma frase, son términos virtualmente incompatibles.
Admitirás que es un punto en contra...
Estoy de acuerdo en que a los elfos del desierto los dibujaron algo elfosexuales, eso es innegable. Algo de "elfúsculo" tienen.
Enviado por Black Rider el 11 Junio, 2013 - 14:14.
no me hables de trolls que me tienen negro
...me tienen diezmados mis elfos del desierto
¡Bah!
Los elfos guaperas y estirados están bien para las quinceañeras. Para armar una buena guerra y mandar trolls y pieles verdes directamente al espacio disforme, lo que necesitas es una buena compañía de enanos.
Hachas rúnicas, barriles de cerveza, arcabuces y mucha testosterona. Superad eso, orejas puntiagudas.
Enviado por suku el 11 Junio, 2013 - 14:07.
@alnus
Hace tiempo estube intentando instalar pytyle pero me faltaba una libreria, no recuerdo concretamente. En cambio encontré esto: https://github.com/TheWanderer/stiler/blob/master/stiler.py en el foro de arch https://bbs.archlinux.org/viewtopic.php?id=64100&p=1, que da el pego. Un icono en tint2 hacia un script y tengo tiling(para pobres eso si).
Enviado por hall9000 el 11 Junio, 2013 - 12:48.
no me hables de trolls que me tienen negro
...me tienen diezmados mis elfos del desierto 
Enviado por pvaldes el 11 Junio, 2013 - 12:20.
La cuulpa fue de trolls y espam...
sí... fue de trolls y espám
que me volvió un caradura
por la mas pura
casualidaaall....
Eso se consigue en un momento, ayudando a otras personas en sus propias dudas... en seguida lo tienes
Enviado por jacembo el 11 Junio, 2013 - 11:10.
buscando los 5 puntitos para poder abrir un tema y pedir ayudaaa!!!