Wikipedia:Dugnadskontor/Endre fra kode til tankestrektegn

Endre fra kode til tankestrektegn rediger

Lagt inn av: Wikijens (diskusjon) 9. mar. 2016 kl. 12:32 (CET)[svar]
Jeg foreslår å endre alle forekomster av – (& ndash;) og – (& #x2013;) til – (tankestrek også i koden). Jeg kan ikke umiddelbart se noen negative konsekvenser, men forslaget må gjerne stå en stund før det eventuelt gjennomføres slik at mulige motforestillinger kan bli presentert. --Wikijens (diskusjon) 9. mar. 2016 kl. 12:32 (CET)[svar]


Tekniske detaljer på foreslått kjøring rediger

Hvilket script som kjøres med lenke til kildekode/hjemmeside.
Hvilke parametre som benyttes.
  • python pwb.py replace.py -fix:ndash-fix -recursive -xml:nowiki-20160305-pages-articles.xml
fixes['ndash-fix']= {
	'regex': True,
	'nocase': True,
	'recursive': True,
	'msg': {
		'_default':u'[[Wikipedia:Dugnadskontor/Endre fra kode til tankestrektegn|Endre fra kode til tankestrektegn]]',
	},
	'replacements': [
		(ur'(&(?:ndash|#x2013);)', ur'–'),
	],
	'exceptions': {
		'inside-tags': [
			'nowiki', 
			'source',
			'pre',
		],
	}
}
Lenke til eventuelt datagrunnlag der dette er mulig å fremvise.

Testkjøring rediger

Bevis på testkjøring uten at noen faktiske endringer er utført. Legges helst inn som en underside av denne jobben

Diskusjon rediger

Hvis konsensus er for kjøringen, skal det settes en dato / tid for når kjøringen i henhold til retningslinjene kan utføres tidligst.

Antar denne jobben er ganske uproblematisk rent teknisk. Kanskje legge ut en kort melding på Tinget/Torget for å se om det er noen innvendinger? --Wikijens (diskusjon) 17. mar. 2016 kl. 14:39 (CET)[svar]

Har lagt inn en notis på Tinget nå. Stigmj (diskusjon) 17. mar. 2016 kl. 14:47 (CET)[svar]
Grunnen til at dette er en dårlig idé finnes i gamle diskusjoner på Tinget. (Her er en fra 2004: Wikipedia:Tinget/Arkiv 3#Bindestreker / tankestreker.) Såvidt jeg husker skal vi ha konsensus på at en slik endring ikke skal gjøres. Vi skal til og med ha presisert dette flere ganger. Noen får rote frem riktig tråd, det er flere titalls av dem. Kortversjonen er at i wikitekst fremstår tankestrek som bindestrek, og vil etter en slik endring suksessivt bli endret til bindestrek, som er feil. — Jeblad 17. mar. 2016 kl. 14:54 (CET)[svar]
Hvis dette stemmer, burde vel botjobben eventuelt gjøres motsatt vei. Men jeg ønsker nok å bestride denne konsensus med henvisning til teknologisk utvikling. Jeg husker også tidligere å ha hatt problemer med å se forskjell på bindestrek og tankestrek i redigeringsmodus, men på nåværende maskin (mac) er det helt uproblematisk å se forskjell både med Safari og Firefox. Hvis det fortsatt er (kombinasjoner av) maskiner/nettlesere/fonter som ikke viser forskjellen, må det vel snart kunne sies at det er de som har problemet, ikke Wikipedia? --Wikijens (diskusjon) 17. mar. 2016 kl. 15:02 (CET)[svar]
Tror ikke jeg kjøper det argumentet. Vi har forøvrig gjort noen tilsvarende endringer, hvor blant annet   ble omskrevet til riktig Unicode, med påfølgende problemer. — Jeblad 17. mar. 2016 kl. 15:17 (CET)[svar]
Kunne du gi en vurdering av hvor problemet med visning av bindestrek i redigeringsmodus ligger (maskin/nettleser/"wikipedia-utseende")? Dette for å kunne vurdere omfanget av problemet og eventuelt se an om det løses i fremtiden. Har kun tilgang til én maskin hvor jeg sitter, så får ikke testet med andre oppsett. --Wikijens (diskusjon) 17. mar. 2016 kl. 15:22 (CET)[svar]
Problemet arter seg litt forskjellig med hvilket fontsett som brukes. Til høyre er noen nettlesere, det er ikke helt likt mellom nettlesere og OS hvordan dette slår ut. Vi har (delvis?) skiftet problemet fra sammenblanding av bindestrek og tankestrek, til sammenblanding av kort (ndash) og lang (mdash) tankestrek. Det kan faktisk se ut som om kort tankestrek er lengre enn lang tankestrek på Chromium. — Jeblad 17. mar. 2016 kl. 18:38 (CET)[svar]
Hmm. Hvis det er den generelle situasjonen, kanskje vi kan ha bindestrek som vanlig unicode, tankestrek (ndash) som vanlig unicode, mens lang tankestrek (mdash) (uansett lite brukt i norsk typografi) har html-kode i redigeringsmodus? --Wikijens (diskusjon) 17. mar. 2016 kl. 18:47 (CET)[svar]
Min mening er at denne endrignen var uønsket tidligere og fortsatt er uønsket. — Jeblad 17. mar. 2016 kl. 18:49 (CET)[svar]
Jeg forstår det ut fra eksemplene at det tidligere argumentet (tankestrek og bindestrek ser likt ut i redigeringsmodus) ikke lenger er gjeldende. Når det da er mellom mdash og ndash sammenblanding kan være relevant, synes jeg det holder at den minst brukte (mdash) markeres, mens den mye brukte (ndash er eller bør være i annenhver artikkel minst, skulle jeg tro) ikke trenger å markeres. Er det eventuelt andre argumenter for html-kode? --Wikijens (diskusjon) 17. mar. 2016 kl. 19:14 (CET)[svar]
Prøv MS Edge, der er problemet bindestrek og tankestrek. Forskjellige nettlesere og OS har forskjellig variasjon over samme tema. — Jeblad 17. mar. 2016 kl. 21:02 (CET)[svar]
Er ikke dette noe MS Edge burde fikse? Tror uansett html-kode for de fleste er ennå mere forvirrende enn tankestreker som ser ut som bindestreker eller omvendt. Men ser ikke ut til at vi blir enige ;-) --Wikijens (diskusjon) 17. mar. 2016 kl. 21:19 (CET)[svar]
Uansett takk for eksemplene. Om vi ikke skulle gjøre noen endringer i denne omgang, er det greit å vite for fremtiden, om problemet skulle bli løst i alle kombinasjoner av OS/nettlesere. Hvis tankestrek også kunne bli like lett tilgjengelig på tastaturet for PC som det er for Mac, tror jeg problemet vil kunne løse seg av seg selv. --Wikijens (diskusjon) 17. mar. 2016 kl. 21:22 (CET)[svar]
Muligens kan en bruke IME for å få dette rett mens en redigerer. Noen av disse tegnene (hyphen-minus) kan da konverteres til mer spesifikke tegn, gitt hvordan de er brukt. Har ikke hatt tid til å teste det ut, men tankestrek ville være en hyphen-minus med space på begge sider. Selv om vi kan lage et IME-oppsett så er det ikke gitt at vi får folk til å bruke det. I noen editorer for programmer kan en sette at terminatorer og whitespace skal være synlig. Kanskje dette kan løse deler av problemet, men da slår en typisk på synlighet for alt. — Jeblad
I MS Word var/er det jo sånn at bindestrek blir til tankestrek når det er space på begge sider. Jeg tror uansett ikke det er så viktig her, det vil kanskje hjelpe for bruk av tankestrek i bokstavelig forstand, men den klart hyppigste bruken hos oss er vel som fra-og-til tegn, altså 1892–1905 uten mellomrom? --Wikijens (diskusjon) 24. mar. 2016 kl. 21:44 (CET)[svar]
Det er flere varianter av «strek», og noen av de kan vi påvise med en IME. Noen av dem er imidlertid ikke helt enkelt å påvise. Dette bør prøves ut før vi begynner å endre tegn til former som vi ikke enkelt kan se forskjell på. Jeg tror vel også at om vi endrer disse tegnene, så må vi kun endre de tegnene som en IME kan vedlikeholde med rimelig grad av sikkerhet. Det vil si at vi muligens kan endre \d-\d til minus og \s-\s til n-dash, men at vi ikke kan endre \w-\d til minus eller \w-\s til n-dash. — Jeblad 31. mar. 2016 kl. 20:21 (CEST)[svar]

Hva med å endre « (laquo) og » (raquo) til henholdsvis « og »? --Wikijens (diskusjon) 2. apr. 2016 kl. 00:54 (CEST)[svar]