რა არის HTML ერთეულები

click fraud protection

ჰიპერტექსტის მარკირების ენა, ან HTML, არის პირველადი ენა ვებ გვერდებისთვის ინტერნეტში. იგი მოიცავს მრავალი სხვა ენების მხარდაჭერას, რომლებიც ამატებენ დამატებით ფუნქციონირებას და სტილს, როგორიცაა JavaScript და CSS. ყველა ეს ენა დაფუძნებულია ტექსტზე რამდენიმე მნიშვნელოვანი სიმბოლოებით, რომლებიც გამოიყენება ლიტერატურული სტრიქონების გამოსაყოფად, რომლებიც უნდა დაიბეჭდოს ბრაუზერში და კოდი, რომელიც უნდა იყოს ინტერპრეტირებული და შესრულებული.

თუმცა, ამ დიზაინს აქვს გარკვეული პრობლემები, ეს აშკარა ხდება, როდესაც გსურთ ბრაუზერში დაბეჭდოთ ერთ-ერთი მნიშვნელოვანი სიმბოლო. სიმბოლოების საუკეთესო მაგალითია სიმბოლოები "ნაკლები" და "მეტი ვიდრე" სიმბოლოები. შესაბამისად ეს სიმბოლოები გამოიყენება HTML-ში კოდის სეგმენტების გასახსნელად და დახურვისთვის. ამ სიმბოლოების ეკრანზე უსაფრთხოდ დაბეჭდვის სწორი მეთოდია HTML ერთეულების გამოყენება.

HTML ერთეულები და უსაფრთხოება

ამ სიმბოლოების განსაკუთრებული მნიშვნელობის წყალობით, თქვენ ნამდვილად ფრთხილად უნდა იყოთ, რათა დარწმუნდეთ, რომ შეცვლით მათ HTML ერთეულის ვერსიით, თუ გსურთ მათი დაბეჭდვა ბრაუზერში. სამწუხაროდ, ბევრ ვებ დეველოპერს ავიწყდება, რომ მომხმარებლებს შეუძლიათ შენიშვნების გაგზავნა ბევრ ვებსაიტზე. თუ მომხმარებლის ეს შეყვანა შეიცავს მნიშვნელოვან სიმბოლოებს და ისინი არ შეიცვლება HTML ერთეულებით, ამ პროცესში, რომელსაც ეწოდება სანიტარული, მაშინ ვებსაიტს აქვს Cross-Site Scripting (XSS) დაუცველობა.

რჩევა: არ სცადოთ სპეციალური სიმბოლოების გაგზავნა ვებსაიტებზე, რათა იპოვოთ XSS დაუცველობა. ამის გაკეთება ტექნიკურად ჰაკერია და არის სისხლის სამართლის დანაშაული, თუ არ გაქვთ ნებართვა ვებსაიტის მფლობელისგან.

როგორ მუშაობს HTML ერთეულები (და ზოგჯერ არა)

HTML ერთეულები მუშაობენ, რადგან ბრაუზერმა იცის, აჩვენოს ის, როგორც შესაბამისი სპეციალური სიმბოლო და არ განიხილოს როგორც სპეციალური სიმბოლო. ყველა HTML ერთეული იწყება ამპერსანტით „&“ და მთავრდება ნახევარმძიმით „;“. სიმბოლოების უმეტესობა იდენტიფიცირებულია ერთეულის ნომრით, თუმცა ზოგიერთ სპეციალურ სიმბოლოს აქვს სტენოგრაფიული სახელიც. მაგალითად, "&", "" აქვთ ერთეულის ნომრები "&", "", ასევე ერთეულების სახელები "&", "", შესაბამისად. ბრაუზერმა იცის, რომ ეს სტრიქონები ნიშნავს, რომ მას შესაბამისი სიმბოლოების ჩვენება სჭირდება.

რჩევა: შეგიძლიათ იხილოთ სიმბოლოების ერთეულების სახელების სრული სია აქ, თუმცა ერთეულის სახელის მხარდაჭერა განსხვავდება ბრაუზერის მიხედვით.

უმეტეს შემთხვევაში, მომხმარებლებმა უნდა ნახონ მხოლოდ სიმბოლოები, რომლებსაც წარმოადგენენ HTML ერთეულები. თუმცა, შესაძლებელია დაინახოთ დაშიფრული სიმბოლოები, ჩვეულებრივ ამპერსანტები "&", პროცესის მეშვეობით, რომელსაც ეწოდება "ორმაგი კოდირება". ეს ხდება მაშინ, როდესაც ამპერსანდის სიმბოლო გამოჩნდება საკუთარ დაშიფრულ ვერსიაში. ორმაგი დაშიფვრა ჩვეულებრივ ხდება მაშინ, როდესაც შეყვანა სწორად არის კოდირებული, როგორც ეს წარმოდგენილია, თუმცა, როდესაც ის გამოდის, ის კვლავ გაწმენდილია. ეს იწვევს ამპერსნდს „&“-ის დასაწყისში მეორედ დაშიფრული და გამოჩნდება როგორც „&“, შემდეგ ბრაუზერი სწორად განმარტავს ამას, როგორც სტრიქონს, რომელიც უნდა დაიბეჭდოს როგორც "&", რომელმაც გაშიფრა HTML ერთეული და იგნორირება გაუკეთა ნაწილობრივ ერთეული.