跳转到内容

用户讨论:InternetArchiveBot

页面内容不支持其他语言。
维基百科,自由的百科全书
(差异) ←上一修订 | 最后版本 (差异) | 下一修订→ (差异)

软重定向m:User talk:InternetArchiveBot
本页面为软重定向

有关台湾企业永续奖资料更新

[编辑]

2023已新增了很多奖项,加上内容的数据内容为2021年, ESG的发展极快,应几时更新正确的资料给予大众观看。--Williamchong92留言2023年7月13日 (四) 05:53 (UTC)[回复]

World--180.217.193.171留言2024年3月13日 (三) 02:20 (UTC)[回复]

黄刚 (1946年)的快速删除通知

[编辑]

您好,有编者认为您创建的页面黄刚 (1946年)内容不当,符合快速删除条件,该页面很快会由管理员进行复核并决定是否保留。
维基百科非常欢迎您的编辑,但请先看看编辑帮助维基百科不是什么,以免犯了常见的错误

请不要自行移除快速删除模板,快速删除旨在加快处理显然不合适的页面。若您认为删除理由不合适或您已对页面做了改善,请在被提删页面快速删除模板的正下方加入{{Hang on}},并在页面的讨论页中说明理由。您亦可以与提删的维基人进行沟通,多谢合作!
帮助:互助客栈 · 删除指导 · 存废复核请求 · IRC聊天频道--GZWDer留言2023年9月9日 (六) 11:01 (UTC)[回复]

Talk:CGTN Radio的快速删除通知

[编辑]

您好,有编者认为您创建的页面Talk:CGTN Radio内容不当,符合快速删除条件,该页面很快会由管理员进行复核并决定是否保留。
维基百科非常欢迎您的编辑,但请先看看编辑帮助维基百科不是什么,以免犯了常见的错误

请不要自行移除快速删除模板,快速删除旨在加快处理显然不合适的页面。若您认为删除理由不合适或您已对页面做了改善,请在被提删页面快速删除模板的正下方加入{{Hang on}},并在页面的讨论页中说明理由。您亦可以与提删的维基人进行沟通,多谢合作!
帮助:互助客栈 · 删除指导 · 存废复核请求 · IRC聊天频道--Mafalda4144留言2023年11月4日 (六) 10:56 (UTC)[回复]

InternetArchiveBot故障?

[编辑]

这两天突然发现User:InternetArchiveBot无法识别{{Cite web}}、{{Cite news}}等系列模板中已添加的存档,而是直接在模板外添加了{{Wayback}},导致大量引用来源出现重复的存档链接(如:[1]);即使Cite系列模板没有存档链接,也不会填进去(如:[2])。我已在P站提单,暂未得到回复;但刚刚发现机器人在其他站点的工作是正常的(如西语维基百科英语维基百科)……想请教是否会与本地的一些配置有关?以及我认为有必要将这两天机器人做的编辑全数回退……--Tim Wu留言2024年5月4日 (六) 17:55 (UTC)[回复]

问题持续中,现在还是重复添加{{Wayback}}。InternetArchiveBot的条目修改量也不少,在解决问题之前,能否先禁止这个bot的在zhwiki的运行。--Nostalgiacn留言2024年5月6日 (一) 03:04 (UTC)[回复]
不反对暂时禁止。--Tim Wu留言2024年5月6日 (一) 03:14 (UTC)[回复]
不确定是bug还是只是参数识别问题,因为用iabot界面编辑存档的话,参数名为“archive-date”和“archive-url”,可能是原来的模板参数对不上而无法处理?——Sakamotosan路过围观 | 避免做作,免敬 2024年5月6日 (一) 07:26 (UTC)[回复]
现在有没有横杠都识别不出来。--Tim Wu留言2024年5月6日 (一) 07:31 (UTC)[回复]
像这个更改Special:Diff/82526887,{{Cite web}}的参数就是archive-urlarchive-date,但bot还是在模板外加的{{Wayback}}。--𝓧𝓩𝓣𝓓𝓮𝓪𝓷𝕋𝕒𝕝𝕜2024年5月6日 (一) 10:05 (UTC)[回复]
刚试了用iabot界面编辑存档,出现了同样问题。连带之前没有存档的也是以{{Wayback}}存档。--S叔 2024年5月6日 (一) 12:48 (UTC)[回复]
虽然但是我觉得应该联系机器人维护者@Cyberpower678Harej而不是去phab开工单……我觉得该问题是机器人本身的问题与mw没啥关系,机器人也不是基金会人员所有的。--忒有钱 🌊塩水あります🐳留言2024年5月9日 (四) 19:24 (UTC)[回复]
工单也加了Cyberpower678。但如果直接去对方用户讨论页提醒一下,或者先咨询一下是不是出了一些问题,应该会更好。——Sakamotosan路过围观 | 避免做作,免敬 2024年5月10日 (五) 00:23 (UTC)[回复]
是在机器人元维基问题回报页反馈无果后才提单的,虽然两处直到现在都没有更新,很失望。--Tim Wu留言2024年5月10日 (五) 03:37 (UTC)[回复]
建议修复前先禁用吧。另外IABOT工具也是在{{cite}}模板之外添加的存档,不论archive-url是否已经填写。--Kethyga留言2024年5月10日 (五) 03:32 (UTC)[回复]
另外,还有IABotManagementConsole的也是,见 Special:Diff/81922170/82595494标签:IABotManagementConsole最近更改。--Kethyga留言2024年5月11日 (六) 01:18 (UTC)[回复]
有必要按照Wikipedia:忽略所有规则立刻禁用该机器人,避免受影响范围扩大--Dnaimfz留言2024年5月14日 (二) 12:10 (UTC)[回复]
此机器人的自动作业已停止,但这期间仍有用户通过 IABotManagementConsole 添加存档。--Tim Wu留言2024年5月14日 (二) 13:07 (UTC)[回复]

管理人员解任投票通告

[编辑]

Mys_721tx的管理员解任投票(第2次)正在进行,投票期为2024年7月12日7月26日,诚邀您踊跃参与投票。


投票须知
  • 依据方针,本次投票必须按照指定格式在安全投票的“投票留言”框内填写文字来进行投票,并给出理由
  • 由于技术原因,因而保留空白的投票选项,但空白选项是无效的,请在“投票留言”一栏留下您的投票及理由
  • 请注意,中立票意见仅供参考,仅能计入总有效票数,但不会计入得票比率
  • 在系统中,每个用户只有一票会被储存。您可以在投票期间重复更改您的投票,但系统只会储存最新的投票,并覆盖之前的记录。
  • 请尽可能让您的留言简洁。请注意,您的投票留言将在投票结束后打乱顺序并公开可见
指定格式
  • 支持解任:您的理由
  • 反对解任:您的理由
  • 中立:您的意见留言

建议在您的投票留言最前面写“支持解任”或“反对解任”或“中立”,之后是冒号“:”,接着是您的理由。

明确填写“支持解任”或“反对解任”或“中立”并给出理由,中立票意见仅供参考不会计入得票比率,未填写“支持解任”或“反对解任”或“中立”的为无效票


进入投票页面查看解任理由

MediaWiki message delivery留言2024年7月14日 (日) 14:31 (UTC)[回复]

邀请您参与管理人员任免及仲裁委员会制度讨论

[编辑]
注:此通告由MediaWiki message delivery留言)于2024年9月21日 (六) 13:36 (UTC)寄送。若您未来长期或目前暂时不欲接收任何类似讯息,可考虑婉拒消息发送[回复]

有关IABot对URL字符编码的行为

[编辑]


据观察,IABot会将源码中能编码的字符都编掉,无视原来的写法,这导致源码难以阅读且不必要地增加条目长度。例子见special:diff/84907263。每个3字节的汉字都会换成9字节的%xx%xx%xx,再算上url + archive-url,效果双倍。一旦条目中含此类URL的连结较多,对长度的影响将变得明显。例子见special:diff/84911755,所有url编码所带来的额外长度达条目的30%(157284/513488)。

如果本来填的URL并未进行编码就代表不编码也能存取吧,再进一步说,有没有情况是一定要进行编码?如果可以的话应停止此行为。

个人认为应该将所有URL编码移除(一个例外是%20,空格会触发警告),但若IABot行为不改,将降低成效,所以先单独处理此行为。--惣流·明日香·兰格雷不姓 2024年11月10日 (日) 01:14 (UTC)[回复]

URL的编码原理。——Sakamotosan路过围观 | 避免做作,免敬 2024年11月10日 (日) 02:56 (UTC)[回复]
这我大概了解,但有什么技术上的原因必须将汉字进行编码吗?即使无法显示也不影响存取吧(见无韩语字型浏览ko.wiki),在可读性上也是不编码更佳(图中的6个方块 vs %EC%9C%84%ED%82%A4%EB%B0%B1%EA%B3%BC:%EB%8C%80%EB%AC%B8)。--惣流·明日香·兰格雷不姓 2024年11月10日 (日) 03:33 (UTC)[回复]
  • 有“空格”字元的新闻连结、作品名称等必须使用%XX各式;请不要跟我说维基百科自动会将内部链接的空格换成底线( _ ),那如果连结是“yahoo新闻”怎么办?你觉得Yahoo新闻会帮你转换?其他网站才没有这种功能。之所以 有“空格”字元的新闻连结、作品名称等必须使用%XX各式是因为如果你在维基百科外部链接语法中直接输入空白,连结会被截断,你必须写成%20才不会被截断
@Sohryu Asuka Langley Not Shikinami,你自己看,不使用%xx写的连结直接都坏掉了耶,根本连不到目标页,因为维基语法就是这样读取啊,网址后段全部截掉了,被当成显示的文字,行为完全错误,不符预期;请不要跟我说维基百科自动会将内部链接的空格换成底线( _ ),那如果连结是“yahoo新闻”怎么办?你觉得Yahoo新闻会帮你转换?其他网站才没有这种功能。%XX写法仍有必须存在、必须使用的时机。-- 宇帆-娜娜奇🐰鲜果茶☕在维基百寻求休闲是否搞错了什么☎️·☘️2024年11月10日 (日) 04:45 (UTC)[回复]
第二弹
链接:維基百科:頁面存廢討論/記錄/2024/11/10#30天后仍掛有{{notability}}模板的條目
对比
维基百科:页面存废讨论/记录/2024/11/10#30天后仍挂有模板的条目(系统提示:无法找到此话题,可能已被删除、移动、或重新命名。)
vs
[[维基百科:页面存废讨论/记录/2024/11/10#30天后仍挂有模板的条目]](链接损毁)
vs
[[维基百科:页面存废讨论/记录/2024/11/10#30天后仍挂有{{notability}}模板的条目]](链接损毁)
vs
维基百科:页面存废讨论/记录/2024/11/10#30%E5%A4%A9%E5%90%8E%E4%BB%8D%E6%8E%9B%E6%9C%89%7B%7Bnotability%7D%7D%E6%A8%A1%E6%9D%BF%E7%9A%84%E6%A2%9D%E7%9B%AE(只有这个是正确的)
以上-- 宇帆-娜娜奇🐰鲜果茶☕在维基百寻求休闲是否搞错了什么☎️·☘️2024年11月10日 (日) 05:04 (UTC)[回复]
%20空格的问题我知道,也提出了是要保留的例外。由于本来是针对IABot的行为,确实没想到{之类的问题,但此类字符加起来大概就十来二十个吧,应该不难处理?比如你的例子其实可以写成维基百科:页面存废讨论/记录/2024/11/10#30天后仍挂有%7B%7Bnotability%7D%7D模板的条目。--惣流·明日香·兰格雷不姓 2024年11月10日 (日) 06:46 (UTC)[回复]
@Sohryu Asuka Langley Not Shikinami 抱歉,您的链接无效。我点进去不但没有跳转到任何章节,右上角还提示:“无法找到此话题,可能已被删除、移动、或重新命名。”。-- 宇帆-娜娜奇🐰鲜果茶☕在维基百寻求休闲是否搞错了什么☎️·☘️2024年11月10日 (日) 07:05 (UTC)[回复]
简繁问题,维基百科:页面存废讨论/记录/2024/11/10#30天后仍挂有%7B%7Bnotability%7D%7D模板的条目才对。 捂脸--惣流·明日香·兰格雷不姓 2024年11月10日 (日) 07:14 (UTC)[回复]
  • (:)回应[引述]确实没想到{之类的问题,但此类字符加起来大概就十来二十个吧,应该不难处理?比如你的例子其实可以写成[...][引述](:)回应:@Sohryu Asuka Langley Not Shikinami
 ​并非。  ​你怎么保证所有浏览器都用“相同的编码方式”处理文字‘天后仍挂有模板的条目’这些文字?  ​你怎么保证所有服务器都用相同的解析方式解析文字‘天后仍挂有模板的条目’这些文字?  #30​ ​%E5​ ​%A4​ ​%A9​ ​%E5​ ​%90​ ​%8E​ ​%E4​ ​%BB​ ​%8D​ ​%E6​ ​%8E​ ​%9B​ ​%E6​ ​%9C​ ​%89​ ​ ​%7B​ ​%7B notability %7D​ ​%7D ​ ​%E6​ ​%A8​ ​%A1​ ​%E6​ ​%9D​ ​%BF​ ​%E7​ ​%9A​ ​%84​ ​%E6​ ​%A2​ ​%9D​ ​%E7​ ​%9B​ ​%AE​ ​ ​才是可以确保所有设备正确解析为 #30天后仍掛有​ ​{{​ ​notability​ ​}}​ ​模板的條目 ​的方式吧。以维基百科目前后台的作法,没有别的方式。-- 宇帆-娜娜奇🐰鲜果茶☕在维基百寻求休闲是否搞错了什么☎️·☘️2024年11月10日 (日) 08:17 (UTC)[回复]
从外链问题讨论到内链,并且没搞清楚目录和片段ID的编码问题,真服了。如果想保证页面内目录的片段ID跳转准确的话,可以直接点击目录的链接,看一下mw输出的锚点值,抄下来就可以了。——Sakamotosan路过围观 | 避免做作,免敬 2024年11月10日 (日) 07:26 (UTC)[回复]
其实我的意思就是,URL编码化才是URL正确的形式。如果不进行URL编码保存进wikicode代码的话,实际上mw渲染时不会再做URL编码处理而原样输出(oldid=84916049,打开开发者工具看一下链接href属性)。这时候URL请求的编码化就落在浏览器上,这可能会导致请求行为不确定(我的工作,见过项目处理这种不URL编码且不属于ASCII编码集的连接,服务器识别会出现请求字符错误的情况)。这种不懂技术想缩数的做法没啥好说的。——Sakamotosan路过围观 | 避免做作,免敬 2024年11月10日 (日) 07:11 (UTC)[回复]
所以是为了浏览器的兼容性而不能改吗?那反过来说,应该要确保含汉字(及其他非ASCII)的连结必须被编码化?--惣流·明日香·兰格雷不姓 2024年11月10日 (日) 07:52 (UTC)[回复]
可以理解为没必要处理,因为URL的编码模式就是这样。——Sakamotosan路过围观 | 避免做作,免敬 2024年11月10日 (日) 08:30 (UTC)[回复]
-- 宇帆-娜娜奇🐰鲜果茶☕在维基百寻求休闲是否搞错了什么☎️·☘️2024年11月10日 (日) 08:22 (UTC)[回复]
正常来说是会被编掉,但比如我最初提的special:diff/84907263,假若编者当时连archive-url都填好,就不会被IABot处理,那不就有潜在问题了?--惣流·明日香·兰格雷不姓 2024年11月10日 (日) 08:39 (UTC)[回复]
这个你应该找Iabot系列的开发者讨论这个问题。但我认为,1.URL的百分位编码才是针对非ASCII字符编码下的URL请求的正确处理模式;2.外链语法在mw是会原样输出的;3.URL的非ASCII字符编码在浏览器上做了一些“人性化”处理(包括百分位解码显示和再次连接请求时的百分位编码),但不保证兼容。不要纠结这种码元问题。——Sakamotosan路过围观 | 避免做作,免敬 2024年11月10日 (日) 11:39 (UTC)[回复]
哈,我工作中也遇到过这类问题,非常头疼--百無一用是書生 () 2024年11月11日 (一) 03:02 (UTC)[回复]
( π )题外话:例子中的香港01,去掉URL中的标题部分也能正常打开(如https://www.hk01.com/%E9%A3%9F%E7%8E%A9%E8%B2%B7/868261)。--Kcx36留言2024年11月10日 (日) 07:48 (UTC)[回复]
需要看对应服务器的代码设计,实际上这些文章查看器的每一笔数据应该对应一个类似数字或者UUID等组成的唯一业务ID,只需要传入这个ID就能获得相应的文章数据,URL中的标题信息可能不是必要的,也可能是SEO策略,方便搜索引擎捕捉关键词。像我们这种URL直接依靠“标题”来获得文章资源的应该少见(?),虽然每个页面是存在pageid这个类似唯一业务ID,可以通过特殊:重定向来唯一获得。——Sakamotosan路过围观 | 避免做作,免敬 2024年11月10日 (日) 08:30 (UTC)[回复]
本质上是encodeURIencodeURIComponentmw.util.wikiUrlencode三者行为的差异,既然场景是对外的,就应尽可能保证兼容,即使用encodeURIComponent。--安忆Talk 2024年11月14日 (四) 08:18 (UTC)[回复]

续:有关IABot对URL字符编码的行为

[编辑]

@Cwek像我们这种URL直接依靠“标题”来获得文章资源的应该少见(?),虽然每个页面是存在pageid这个类似唯一业务ID,可以通过特殊:重定向来唯一获得。”,可以通过pageid链接访问维基百科页面(比如 https://zh.wikipedia.org/?curid=5685170&redirect=no ),但是不能用在页面内链上就是了。--Txkk留言2024年11月25日 (一) 07:30 (UTC)[回复]

添加以下代码到Special:MyPage/common.js即可获取该gadget:
mw.loader.load('//meta.wikimedia.org/wiki/User:Txkk/CurIDLink.js?action=raw&ctype=text/javascript');
--Txkk留言2024年11月25日 (一) 07:37 (UTC)[回复]